Open YuzhouPeng opened 9 months ago
还是尝试将模型尽量往大了做吧。loss啥的看看是否正常,是否能够到2.x。
还是尝试将模型尽量往大了做吧。loss啥的看看是否正常,是否能够到2.x。
loss降到1.5了,还是不行,训练数据有什么好的推荐吗?
还是尝试将模型尽量往大了做吧。loss啥的看看是否正常,是否能够到2.x。
loss降到1.5了,还是不行,训练数据有什么好的推荐吗?
看看效果不好应该是这个原因 https://github.com/DLLXW/baby-llama2-chinese/issues/50
你好,我pretrain和sft各训练了8轮,输出还是胡言乱语,我用的baidu+wiki+医疗train作为pretrain数据集没有改数据,sft也没有改数据集。其他参数都没改,用的初始参数,没有用sft_to_pretrain,想问下您那边是怎么训的?