Closed kuto5046 closed 4 years ago
Bellemare, Marc G, Dabney, Will, Munos, Rémi http://arxiv.org/abs/1707.06887
Q関数を期待値ではなく分布として求める分布強化学習をDQNに適用。分布を求めることで目的に関連する多数のタスクを学習可能。カテゴリ数(分布のヒストグラムのbin数)を増やすことで表現力が増え性能も向上。
Bellemare, Marc G, Dabney, Will, Munos, Rémi http://arxiv.org/abs/1707.06887