Open 1263152934 opened 8 months ago
除了xavier_normal_的权重初始化,training是否还有其他细节,如果方便的话能否提供原始的训练代码
原始代码已经上传了,可以试试,hsir 那套重构的代码我之前复现确实有点问题(不过我自己对过好几遍也没找出原因在哪),原始代码训过很多次应该没有问题,如果有问题可以再讨论。
https://github.com/Zeqiang-Lai/HSDT/tree/main/train
好的,非常感谢,麻烦您了
除了xavier_normal_的权重初始化,training是否还有其他细节,如果方便的话能否提供原始的训练代码