Open nobody-cheng opened 5 years ago
您好,首页readme上的params大小是指加载预训练模型的大小? 我最后训练得到的模型权重ckpt文件有900多m,这个怎么会差这么多?
@nobody-cheng V1的代码保存了很多乱七八糟的东西,比如说权重的滑动平均值等,我后面只保存网络权重的话,就只有200多M,你可以参考V2和V3修改一下保存模型的代码
您好,首页readme上的params大小是指加载预训练模型的大小? 我最后训练得到的模型权重ckpt文件有900多m,这个怎么会差这么多?