SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

rl-tokyo / survey

強化学習論文のサーベイリポジトリ

13 stars 5 forks source link

Open sotetsuk opened 7 years ago

sotetsuk commented 7 years ago

sotetsuk commented 7 years ago

4/10

BLEU等の指標のかわりにDiscriminatorが報酬を与えるのはそれはそれで面白いが機械翻訳等でどういう結果になるかが気になる