Open neka-nat opened 6 years ago
模倣学習において人の1回のデモで目的のタスクを教示する論文。色のついたブロックを指定通りに積み重ねるというタスクにおいて、予め様々な積み重ね方のタスクを学習させ、未知な積み重ね方に対して1度人がデモを行い、現在状態とデモを入力として行動を生成するネットワークを用いて動作生成を行っている。
https://arxiv.org/abs/1703.07326
Yan Duan, Marcin Andrychowicz, Bradly C. Stadie, Jonathan Ho, Jonas Schneider, Ilya Sutskever, Pieter Abbeel, Wojciech Zaremba
2017/11/25
ドメイン転化を併せた後続研究が発表 #815
一言でいうと
模倣学習において人の1回のデモで目的のタスクを教示する論文。色のついたブロックを指定通りに積み重ねるというタスクにおいて、予め様々な積み重ね方のタスクを学習させ、未知な積み重ね方に対して1度人がデモを行い、現在状態とデモを入力として行動を生成するネットワークを用いて動作生成を行っている。
論文リンク
https://arxiv.org/abs/1703.07326
著者/所属機関
Yan Duan, Marcin Andrychowicz, Bradly C. Stadie, Jonathan Ho, Jonas Schneider, Ilya Sutskever, Pieter Abbeel, Wojciech Zaremba
投稿日付(yyyy/MM/dd)
2017/11/25
概要
新規性・差分
手法
結果
コメント