Closed Jayce1kk closed 2 months ago
在转换权重的代码中将 /Pai-Megatron-Patch/toolkits/model_checkpoints_convertor/qwen/hf2mcore_qwen2_dense_and_moe_gqa.py 中line482行
if full_model[k] is None or "_extra_state" in k:
full_model.pop(k)
修改为下述代码之后不报错,但是不知道对后续的训练有没有影响
if full_model[k] is None :
full_model.pop(k)
您好,报错中仅仅出现extra_state其实不是一个错误,仅需要将strict=False即可
好的,非常感谢您的回复
问题
转换完权重之后进行评估验证时出现下述问题
转换权重指令
评估指令
详细报错