Asynchronous Methods for Deep Reinforcement Learning

kuto5046 / papers

読んだ論文を整理するところ

0 stars 0 forks source link

Closed kuto5046 closed 4 years ago

kuto5046 commented 4 years ago

kuto5046 commented 4 years ago

これまでの深層強化学習で使用されていたExperience replayを廃止し、複数のエージェントを並列に非同期で学習させる方策ベースの分散型強化学習手法を提案。GPUを用いず16個の並列CPUでDQNの半分の時間で当時の最高性能を記録。並列環境を増やすことで性能が向上。