kuto5046 / papers

読んだ論文を整理するところ
0 stars 0 forks source link

Rainbow: Combining Improvements in Deep Reinforcement Learning #8

Closed kuto5046 closed 4 years ago

kuto5046 commented 4 years ago

Hessel, Matteo, Modayil, Joseph, van Hasselt, Hado, Schaul, Tom, Ostrovski, Georg, Dabney, Will, Horgan, Dan, Piot, Bilal, Azar, Mohammad, Silver, David http://arxiv.org/abs/1710.02298

kuto5046 commented 4 years ago

DQNとその改良手法6つを組み合わせたRainbowを提案。改良手法を全て組み合わせた本手法がAtariにおいて最も高いスコアを発揮。学習の立ち上がりも早く学習効率が高い。本論文では各改良手法をRainbowから除いて比較することによる考察も行なっている。 IMG_CAB2627421BA-1 IMG_7F1B31CD20E9-1 IMG_EFC0DAA24245-1