Open 128Ghe980 opened 5 days ago
补充一下,一阶段的纯llm微调使用的无图数据,希望llm端能适应新的任务,后面的阶段尽量仿造了minicpm的预训练阶段的过程
大佬,您好!能不能上传一下funetune文件夹下的dataset.py文件,想参考一下您的,我发现我在微调的时候老是报data fetch error的错误(报错位置定位在dataset.py文件中)。万分感谢!
大佬,您好!能不能上传一下funetune文件夹下的dataset.py文件,想参考一下您的,我发现我在微调的时候老是报data fetch error的错误(报错位置定位在dataset.py文件中)。万分感谢!
可以按照这个pr改一下试试 #579
大佬,您好!能不能上传一下funetune文件夹下的dataset.py文件,想参考一下您的,我发现我在微调的时候老是报data fetch error的错误(报错位置定位在dataset.py文件中)。万分感谢!
可以按照这个pr改一下试试 #579
感谢感谢,就是这个问题
感谢感谢,就是这个问题
对你有用的话,帮忙给pr点个👍,让它更加容易合入吧,免得后面的人在遇到这个问题😊
我的训练方式是分两个阶段
但现在loss曲线很差,请问是什么问题呢
数据集为数学相关,输入题目和图片,输出题目关键点
以下为bash文件中的设置:
不同阶段会修改--llm_tune等设置,其他不变
以下为loss曲线
另外还试了二阶段是train resampler的情况,以下为loss曲线
大概什么问题呢,是任务太难了吗?