Closed kuto5046 closed 4 years ago
Steven Kapturowski et al. https://openreview.net/pdf?id=r1lyTjAqYX
Ape-Xで提案された分散型強化学習アーケティクチャにLSTM(RNN)による時系列性を加味した経験再生を導入。Atariによる実験で学習時間、性能ともにApe-Xを凌駕。RNNによる経験再生を実現するためにStored stateとBurn-inという2つの工夫を行なっている。
Steven Kapturowski et al. https://openreview.net/pdf?id=r1lyTjAqYX