rl-tokyo / survey

強化学習論文のサーベイリポジトリ
13 stars 5 forks source link

Deep Reinforcement Leanring for Dialogue Generation #12

Open sotetsuk opened 7 years ago

sotetsuk commented 7 years ago

https://arxiv.org/abs/1606.01541

sotetsuk commented 7 years ago

4/10

強化学習というよりNLPへの応用の論文。報酬を結構作り込んでるなあという感じ。 こうした問題への応用は強化学習の正しい使い方のように見える。

スライドにまとめた https://docs.google.com/presentation/d/1P_ks8cqXcQmc8rBk7QlxcBHwfSdlNYnPmnWF0yj_nYs/edit#slide=id.g1dc914e3b6_0_126