Closed fourierer closed 2 days ago
对多图我们也是这么处理的 https://github.com/modelscope/swift/blob/main/swift/llm/utils/template.py#L1231-L1236
感谢您的回复,我这边在微调多图任务时报了这个错误 我的数据格式是这样的,images对应一个列表,该列表中包括两张图像:
"images": [ "/mnt/data/code/banqun.sz/intern-vl/SFT/max0619_is_syn/cspuurl/https:ççimg.alicdn.comçimgextraçi4ç6000000006629çO1CN01Amf9Ro1yq8TjEGrT5!!6000000006629-0-alihealth_ic.jpg", "/mnt/data/code/banqun.sz/intern-vl/SFT/max0619_is_syn/skudetection/https:ççimg.alicdn.comçimgextraçi2ç2113790279çTB28plhX3JkpuFjSszcXXXfsFXa!!2113790279.jpg/split_0.jpeg" ], 这样写是否符合要求呢?还是说需要把多张图写在一个字符串元素里面
我这边把这里的assert语句注释掉就可以训练了,这里限制了images对应的长度不能超过1
您好,我在intern-vl下看到您关于多图微调任务的描述,即按照逗号隔开来微调多图任务:
请问按照这种方式微调完成后,推理的时候我可以按照intern-vl原有的的多图推理方式进行推理么 ,就是图中的torch.cat方式: