One-Shot Imitation Learning

一言でいうと

模倣学習において人の1回のデモで目的のタスクを教示する論文。色のついたブロックを指定通りに積み重ねるというタスクにおいて、予め様々な積み重ね方のタスクを学習させ、未知な積み重ね方に対して1度人がデモを行い、現在状態とデモを入力として行動を生成するネットワークを用いて動作生成を行っている。

one_shot_imitation_learning

Yan Duan, Marcin Andrychowicz, Bradly C. Stadie, Jonathan Ho, Jonas Schneider, Ilya Sutskever, Pieter Abbeel, Wojciech Zaremba