datawhalechina / easy-rl

强化学习中文教程(蘑菇书🍄),在线阅读地址:https://datawhalechina.github.io/easy-rl/
Other
9.04k stars 1.81k forks source link

dqn算法问题 #150

Closed ecsfu closed 6 months ago

ecsfu commented 7 months ago

在dqn的更新中,为什么没有下面的代码,不用复制策略网络? if self.sample_count % self.target_update == 0: # 每隔一段时间,将策略网络的参数复制到目标网络 self.target_net.load_state_dict(self.policy_net.state_dict())