DwangoMediaVillage / paper_readings

Dwango Media Village内で行われている論文紹介の資料
58 stars 2 forks source link

Recurrent Experience Replay in Distributed Reinforcement Learning #52

Open kzmssk opened 5 years ago

kzmssk commented 5 years ago

分散Q学習にRNNを導入、経験再生における隠れ層の扱い方を実験的に解析

論文本体・著者

解きたい問題

新規性

実装

実験・議論

fig_1
論文 Fig. 1 より (a): Q値の違いを評価する方法を説明した図。hatが付いている方がReplay時に得られた隠れ層の状態 (b): 隠れ層の初期値(Initial State)と最終時刻における値(Final State)のQ値の違いを示した図。横軸は学習対象となるDMLabのレベルを示している (c): 2つのタスクにおいて6通りの手法を学習させたときの報酬平均の推移
fig_2
論文 Fig. 2 より ATARIの学習結果の抜粋。左の図は学習にかかった時間と達成したスコアを過去の手法と比較した図。右の図はApe-X(RNNなし)との比較

読んだ中での不明点などの感想

関連論文