Open Doufanfan opened 11 months ago
不同样本算出来的评价指标是不一样的。可能刚好没有加载到同样的样本。
不同样本算出来的评价指标是不一样的。可能刚好没有加载到同样的样本。
🤣 每次都是一样的验证、测试数据,我把样本直接按照train、eval、test三部分存了3个文件,每次执行每个部分的数据都是一样的🤭
你好,请问单卡怎么改main.py用lora微调?我改完后跑代码直接报RuntimeError: Expected to mark a variable ready only once.这个了
Is there an existing issue for this?
Current Behavior
基于
main.py
代码改造的,加了lora微调的逻辑,目前没有实现多卡微调,只能单卡微调🤣训练设置
max_steps=5000
,save_step=1000
,训练完成后eval/predict f1=0.68/0.71;后加载checkpoint-5000的eval/predict f1=0.69/0.73😱; 而且还发现一个奇怪的现象:加载checkpoint-5000模型,设置不同的per_device_eval_batch_size,eval/predict f1 也不同😱。。。 per_device_eval_batch_size=6:eval/predict f1=0.68/0.73 per_device_eval_batch_size=16:eval/predict f1=0.69/0.74补充求一下有lora多卡微调的demo吗~ 双卡微调的时候会报错: