TMats / survey

Summary of Paper Survey
https://tmats.github.io/survey/
16 stars 2 forks source link

Zero-Shot Task Generalization with Multi-Task Deep Reinforcement Learning #77

Open TMats opened 7 years ago

TMats commented 7 years ago

https://arxiv.org/abs/1706.05064

TMats commented 7 years ago

アブスト翻訳

強化学習(RL)におけるゼロショットタスク一般化能力を開発する段階として、サブタスクを解決する有用なスキルを学習した後に、一連の命令を実行することを学ぶべき新しいRL問題を導入する。この問題では、2つのタイプの一般化、すなわち、以前には見えない命令と、より長い命令のシーケンスとを考える。見えない命令に対する一般化のために、類似のサブタスク間の学習対応を推論する新しい目的を提案する。遅れた報酬に対処するために、我々は、メタコントローラの中でニューラルアーキテクチャを提案して、より効率的な学習を行うサブタスクをいつ更新するかを提案する。確率的な3次元領域に関する実験結果は、提案されたものが、見えない命令と同様に、より長い命令への一般化に重要であることを示している。