Open kzmssk opened 5 years ago
RNNを使った分散型Q学習アルゴリズムR2D2にエキスパートの軌道からなるReplay Bufferを追加することで探索効率を向上させた
Amazed
RNNを使った分散型Q学習アルゴリズムR2D2にエキスパートの軌道からなるReplay Bufferを追加することで探索効率を向上させた
論文本体・著者
解きたい問題
新規性
実装
実験・議論
読んだ中での不明点などの感想
関連論文