2019: A Survey of Reinforcement Learning Informed by Natural Language

A Survey of Reinforcement Learning Informed by Natural Language Jelena Luketina, Nantas Nardelli, Gregory Farquhar, Jakob Foerster, Jacob Andreas, Edward Grefenstette, Shimon Whiteson, Tim Rocktäschel Published at IJCAI'19 https://arxiv.org/abs/1906.03926

概要

NLPでRLを使った研究のサーベイ論文． // 最近（2019含む）の研究の紹介を行っているので，気になるところを読むといい．いろいろな研究を知りたければ第３章（現在の自然言語におけるRLの使われ方），現状を俯瞰したコメントや課題に対する今後の示唆に関しては第４章移行が参考になる（自然言語におけるRLのトレンド）

イントロ

スキップ

背景

強化学習と模倣学習

スキップ

自然言語からの転移

スキップ

現在の自然言語におけるRLの使われ方

下記の2視点で見る（排他に存在しているわけではない）

language-conditional RL
- 言語がタスク定義の一部となっているもの
- 例）自然言語によるインストラクションが，ゴールや報酬になっている
language-assisted RL
- 言語情報はタスクを解くために必要とは限らないが，学習を補助する
- 例）環境ダイナミクスに関する情報を提供

データ獲得の手段として多くの研究がシンプルな文法や語彙を使ったテンプレートスタイルで文を人工的に合成する手段が多い（例："what color is

jojonki / arXivNotes

2019: A Survey of Reinforcement Learning Informed by Natural Language #267

概要

イントロ

背景

強化学習と模倣学習

自然言語からの転移

現在の自然言語におけるRLの使われ方

Language-conditional RL

Language-assisted RL

自然言語におけるRLのトレンド

Learning from Text Corpora in the Wild

Towards Diverse Environments with Real-World Semantics

結論

コメント