Deep Reinforcement Leanring for Dialogue Generation

rl-tokyo / survey

強化学習論文のサーベイリポジトリ

13 stars 5 forks source link

Open sotetsuk opened 7 years ago

sotetsuk commented 7 years ago

sotetsuk commented 7 years ago

4/10

強化学習というよりNLPへの応用の論文。報酬を結構作り込んでるなあという感じ。こうした問題への応用は強化学習の正しい使い方のように見える。