Open icoxfog417 opened 4 years ago
ロボット操作に強化学習を使う際、学習時間が大きな課題となる。そこで、7種類のロボットで記録した1500万のビデオフレームのデータセットを公開。様々なロボットの軌跡データから表現学習(次フレーム予測/過去フレーム予測)を行うことで、Zero/Few shotが可能な転移性能の高いモデルを構築できる。
https://arxiv.org/abs/1910.11215
Sudeep Dasari, Frederik Ebert, Stephen Tian, Suraj Nair, Bernadette Bucher, Karl Schmeckpeper, Siddharth Singh, Sergey Levine, Chelsea Finn
2019/10/24
データの読み込み/学習のためのフレームワーク。TensorFlowへの読み込みもサポートされている。 https://github.com/SudeepDasari/RoboNet
解説ブログ https://bair.berkeley.edu/blog/2019/11/26/robo-net/
一言でいうと
ロボット操作に強化学習を使う際、学習時間が大きな課題となる。そこで、7種類のロボットで記録した1500万のビデオフレームのデータセットを公開。様々なロボットの軌跡データから表現学習(次フレーム予測/過去フレーム予測)を行うことで、Zero/Few shotが可能な転移性能の高いモデルを構築できる。
論文リンク
https://arxiv.org/abs/1910.11215
著者/所属機関
Sudeep Dasari, Frederik Ebert, Stephen Tian, Suraj Nair, Bernadette Bucher, Karl Schmeckpeper, Siddharth Singh, Sergey Levine, Chelsea Finn
投稿日付(yyyy/MM/dd)
2019/10/24
概要
新規性・差分
手法
結果
コメント