kuto5046 / papers

読んだ論文を整理するところ
0 stars 0 forks source link

RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING #18

Closed kuto5046 closed 4 years ago

kuto5046 commented 4 years ago

Steven Kapturowski et al. https://openreview.net/pdf?id=r1lyTjAqYX

kuto5046 commented 4 years ago

Ape-Xで提案された分散型強化学習アーケティクチャにLSTM(RNN)による時系列性を加味した経験再生を導入。Atariによる実験で学習時間、性能ともにApe-Xを凌駕。RNNによる経験再生を実現するためにStored stateとBurn-inという2つの工夫を行なっている。 image image