Zero-Shot Task Generalization with Multi-Task Deep Reinforcement Learning

アブスト翻訳

強化学習（RL）におけるゼロショットタスク一般化能力を開発する段階として、サブタスクを解決する有用なスキルを学習した後に、一連の命令を実行することを学ぶべき新しいRL問題を導入する。この問題では、2つのタイプの一般化、すなわち、以前には見えない命令と、より長い命令のシーケンスとを考える。見えない命令に対する一般化のために、類似のサブタスク間の学習対応を推論する新しい目的を提案する。遅れた報酬に対処するために、我々は、メタコントローラの中でニューラルアーキテクチャを提案して、より効率的な学習を行うサブタスクをいつ更新するかを提案する。確率的な3次元領域に関する実験結果は、提案されたものが、見えない命令と同様に、より長い命令への一般化に重要であることを示している。

TMats / survey

Zero-Shot Task Generalization with Multi-Task Deep Reinforcement Learning #77