Closed kuto5046 closed 4 years ago
Hessel, Matteo, Modayil, Joseph, van Hasselt, Hado, Schaul, Tom, Ostrovski, Georg, Dabney, Will, Horgan, Dan, Piot, Bilal, Azar, Mohammad, Silver, David http://arxiv.org/abs/1710.02298
DQNとその改良手法6つを組み合わせたRainbowを提案。改良手法を全て組み合わせた本手法がAtariにおいて最も高いスコアを発揮。学習の立ち上がりも早く学習効率が高い。本論文では各改良手法をRainbowから除いて比較することによる考察も行なっている。
Hessel, Matteo, Modayil, Joseph, van Hasselt, Hado, Schaul, Tom, Ostrovski, Georg, Dabney, Will, Horgan, Dan, Piot, Bilal, Azar, Mohammad, Silver, David http://arxiv.org/abs/1710.02298