Open sotetsuk opened 7 years ago
https://arxiv.org/abs/1606.01541
4/10
強化学習というよりNLPへの応用の論文。報酬を結構作り込んでるなあという感じ。 こうした問題への応用は強化学習の正しい使い方のように見える。
スライドにまとめた https://docs.google.com/presentation/d/1P_ks8cqXcQmc8rBk7QlxcBHwfSdlNYnPmnWF0yj_nYs/edit#slide=id.g1dc914e3b6_0_126
https://arxiv.org/abs/1606.01541