Closed zhangfan-algo closed 6 months ago
怀疑是多线程冲突引起的
卸载干净 再装一下呗
Traceback (most recent call last):
File "/mnt/pfs/zhangfan/homework_correction/swift_0429/examples/pytorch/llm/llm_sft.py", line 7, in
数据集格式: {"query":"这是学生书写的数字和数学公式相关内容。请你准确说出图片中手写体内容是什么.数学公式用latex表达。你的输出格式必须是:图片中手写体内容是:XXX.let us think step by step","response":"图片中手写体内容是:(数学公式用latex公式表达)\n\n"+str(label),"images":[file_path]}
什么模型呀
internvl-chat-v1_5
方便提供下sft命令和数据样例?
--max_length 1024 太小了,图像部分vit的embeds长度一般都超过1024了。
建议设到2048以上
好的 我试试
大佬 可以了 还想问下 我们目前支持epoch的方式保存模型不
大佬 可以了 还想问下 我们目前支持epoch的方式保存模型不
@Jintao-Huang
目前不支持,仅支持step方式,可以考虑将--save_steps设置为和一个epoch相匹配
卸载干净 再装一下呗 大佬 虚拟环境之前没有装swift 重新跑了一下 还是报错了
硬件配置:4台8*a800