rl-tokyo / survey

強化学習論文のサーベイリポジトリ
13 stars 5 forks source link

SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient #13

Open sotetsuk opened 7 years ago

sotetsuk commented 7 years ago

https://arxiv.org/abs/1611.01626

sotetsuk commented 7 years ago

4/10

BLEU等の指標のかわりにDiscriminatorが報酬を与えるのはそれはそれで面白いが 機械翻訳等でどういう結果になるかが気になる

スライドにまとめた: https://docs.google.com/presentation/d/1P_ks8cqXcQmc8rBk7QlxcBHwfSdlNYnPmnWF0yj_nYs/edit#slide=id.g208b8ad24f_0_14