issues
search
kuto5046
/
papers
読んだ論文を整理するところ
0
stars
0
forks
source link
Asynchronous Methods for Deep Reinforcement Learning
#16
Closed
kuto5046
closed
4 years ago
kuto5046
commented
4 years ago
Volodymyr Mnih
https://arxiv.org/abs/1602.01783
kuto5046
commented
4 years ago
これまでの深層強化学習で使用されていたExperience replayを廃止し、複数のエージェントを並列に非同期で学習させる方策ベースの分散型強化学習手法を提案。GPUを用いず16個の並列CPUでDQNの半分の時間で当時の最高性能を記録。並列環境を増やすことで性能が向上。
Volodymyr Mnih https://arxiv.org/abs/1602.01783