RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING

kuto5046 / papers

読んだ論文を整理するところ

0 stars 0 forks source link

Closed kuto5046 closed 4 years ago

kuto5046 commented 4 years ago

kuto5046 commented 4 years ago

Ape-Xで提案された分散型強化学習アーケティクチャにLSTM(RNN)による時系列性を加味した経験再生を導入。Atariによる実験で学習時間、性能ともにApe-Xを凌駕。RNNによる経験再生を実現するためにStored stateとBurn-inという2つの工夫を行なっている。