kuto5046 / papers

読んだ論文を整理するところ
0 stars 0 forks source link

Massively Parallel Methods for Deep Reinforcement Learning #15

Closed kuto5046 closed 4 years ago

kuto5046 commented 4 years ago

Nair, Arun et al. http://arxiv.org/abs/1507.04296

kuto5046 commented 4 years ago

これまでの深層強化学習は単一GPUでの処理が前提となっていた。そこで深層強化学習に分散処理を適用し、処理速度を向上。Q関数を学習するLearner,環境上で行動するActor,パラメータサーバの3つで構成。従来のおよそ1/3の時間でDQNのスコアを超えた。 IMG_E883BCD5F0EA-1

IMG_634291D38F5B-1