kuto5046 / papers

読んだ論文を整理するところ
0 stars 0 forks source link

A Distributional Perspective on Reinforcement Learning #7

Closed kuto5046 closed 4 years ago

kuto5046 commented 4 years ago

Bellemare, Marc G, Dabney, Will, Munos, Rémi http://arxiv.org/abs/1707.06887

kuto5046 commented 4 years ago

Q関数を期待値ではなく分布として求める分布強化学習をDQNに適用。分布を求めることで目的に関連する多数のタスクを学習可能。カテゴリ数(分布のヒストグラムのbin数)を増やすことで表現力が増え性能も向上。 IMG_8E1EDAC6BCAC-1 IMG_D7F197BFFD4E-1 IMG_BF77560C9679-1