pocokhc / agent57

Qiita投稿用に作成したAgent57(強化学習)の実装コードです。
MIT License
45 stars 14 forks source link

「RDN」について質問です #6

Closed tokin19 closed 4 years ago

tokin19 commented 4 years ago

Qiitaの中で、RNDについての記事があると思います。 コードを作成する際は、次の論文のAlgorithm 1(ページ14)を参考にして作成されましたか?

pocokhc commented 4 years ago

次の論文が何か分かりませんが… NGUの論文のAlgorithm 1はエピソード記憶部の計算しか書いておらずRNDでは参考にしていません。

RNDの計算部分に関しては、2章の "Integrating life-long curiosity" に書いてあります。 それ以外はQiita記事に書いてある通りです。

tokin19 commented 4 years ago

>NGUの論文のAlgorithm 1はエピソード記憶部の計算しか書いておらずRNDでは参考にしていません。 教えていただき、ありがとうございます。

論文を記載せず、大変に、申し訳ありませんでした。 次の論文のことを指しています。 https://arxiv.org/pdf/1810.12894.pdf