Closed ecsfu closed 6 months ago
在dqn的更新中,为什么没有下面的代码,不用复制策略网络? if self.sample_count % self.target_update == 0: # 每隔一段时间,将策略网络的参数复制到目标网络 self.target_net.load_state_dict(self.policy_net.state_dict())
在dqn的更新中,为什么没有下面的代码,不用复制策略网络? if self.sample_count % self.target_update == 0: # 每隔一段时间,将策略网络的参数复制到目标网络 self.target_net.load_state_dict(self.policy_net.state_dict())