kuto5046 / papers

読んだ論文を整理するところ
0 stars 0 forks source link

IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures #20

Closed kuto5046 closed 4 years ago

kuto5046 commented 4 years ago

Espeholt, Lasse et al. http://arxiv.org/abs/1802.01561

kuto5046 commented 4 years ago

学習資源を効率的に使用可能な分散学習エージェントIMPALAと、actorとlearnerをうまく切り離すoff-polcyの学習アルゴリズムV-traceを提案。IMPALAではlearnerからactorに直接パラメータを渡して学習。分散計算資源を容易に拡張でき、マルチタスクにも適用可能。 image image image image image