Open zhouzhou0322 opened 10 months ago
谢谢
None
一般至少数百条数据 微调主要应该看验证集的 Loss 不要看训练集的 Loss 可以微调的
您好,请问在微调时,不同数据量的数据选择微调策略(全参数/bitfit)有什么建议嘛~
我建议最好都是全参数微调,bitfit 是为了微调 7B 以上的模型,但这个算法的效果我自己实验下来不是很理想...
🐛 bug 说明
谢谢
Python Version
None