Open PaPaPaPatrick opened 2 months ago
b站课程:https://www.bilibili.com/video/BV1FM411L7QW?p=11&spm_id_from=pageDriver&vd_source=6ed3d0ed0a847103a02913a24b8a9117
Dueling Network 解决了不唯一性,如何理解,以及为什么dueling Network 网络结构更优的结论是如何得到的? 最大化可以保证训练效果更加稳定,解决不唯一性如何理解? 除了最大化之外还有其他方式能解决不唯一性吗? 在其他领域训练的时候也会有这样的问题吗?
Double DQN的训练方式网络结构及要解决的具体问题
b站课程:https://www.bilibili.com/video/BV1FM411L7QW?p=11&spm_id_from=pageDriver&vd_source=6ed3d0ed0a847103a02913a24b8a9117