kuto5046 / papers

読んだ論文を整理するところ
0 stars 0 forks source link

SEED RL: Scalable and Efficient Deep-RL with Accelerated Central Inference #9

Closed kuto5046 closed 4 years ago

kuto5046 commented 4 years ago

Espeholt, Lasse, Marinier, Raphaël, Stanczyk, Piotr, Wang, Ke, Michalski, Marcin http://arxiv.org/abs/1910.06591

kuto5046 commented 4 years ago

スケーラブルな強化学習エージェントを提案。TPU等の利用により1sあたり数百万フレームの学習を可能とし、既存手法の実験コストを低減する。学習アルゴリズムにはIMPALA/V-traceとR2D2を採用。kaggleで現在開催中のGoogle Research Football環境でSOTAを達成。 IMG_5B57F88B8916-1 IMG_97327524A0A9-1 IMG_4760F0DED4B1-1 IMG_14206ABDC1D4-1