Closed MrWaterZhou closed 1 month ago
如题, 看见这个参数是写死的, 在训练1.5B模型时发现结果有明显异常 https://github.com/alibaba/Pai-Megatron-Patch/blob/bfdc653ba1c8e8e2040a76b551cdcb6800c1e219/examples/qwen2/run_finetune_qwen.sh#L283C1-L284C1
好的,收到,多谢提醒。在更新llama3.1的时候我们会把这个同步修掉
如题, 看见这个参数是写死的, 在训练1.5B模型时发现结果有明显异常 https://github.com/alibaba/Pai-Megatron-Patch/blob/bfdc653ba1c8e8e2040a76b551cdcb6800c1e219/examples/qwen2/run_finetune_qwen.sh#L283C1-L284C1