Open q310194 opened 1 year ago
你好,最近在閱讀強化學習相關的論文,偶然發現您的Code,最近在研究中
以下是我遇到的一些問題
1.所謂的DQN是指用CNN來預測Q值 那這樣DQN跟CNN有甚麼差別呢? loss function的不同嗎? 2.如何更改資料集 ? 例如ft06 改la 09 3.程式碼中預設dueling為F 代表使用ddqn模型嗎? 4.前幾次疊代會出現這樣的原因是甚麼?
謝謝您的回答
针对问题2,你可以在run_config.yaml中修改所用算例。 针对问题3,False是not dueling,True使用DDQN 针对问题4,因为算例或计算过程中有0 针对问题1,我理解的是CNN提取特征,并不能计算长期汇报部分
你好,最近在閱讀強化學習相關的論文,偶然發現您的Code,最近在研究中
以下是我遇到的一些問題
1.所謂的DQN是指用CNN來預測Q值 那這樣DQN跟CNN有甚麼差別呢? loss function的不同嗎? 2.如何更改資料集 ? 例如ft06 改la 09 3.程式碼中預設dueling為F 代表使用ddqn模型嗎? 4.前幾次疊代會出現這樣的原因是甚麼?
謝謝您的回答