Closed Zmeo closed 1 month ago
👋嗨喽,很高兴您关注我们模型并且尝试微调,我们已经尝试复现了一下您问题中给出的case,在直接推理的情况下发现是没有坐标偏差的~ @Zmeo
@Cuiunbo 您好,我用的模型是MiniCPM-V 2.0,用online demo试了您的prompt之后没有给出明确的定位 在我的观察中,用训练数据直接推理是相对较准的,但是训练数据外的自然语言描述就会有所偏移
您好,一般情况下如果sft训练数据过于单一的话,会使模型对于丰富自然语言描述的跟随能力下降。如您的场景是需要用丰富自然语言交互的场景,可尝试使用语言模型对您的数据进行多样性润色
是否已有关于该错误的issue或讨论? | Is there an existing issue / discussion for this?
该问题是否在FAQ中有解答? | Is there an existing answer for this in FAQ?
当前行为 | Current Behavior
我基于原始模型首先进行了coco-en-2-mini的微调,随后基于该版本进行了带坐标数据的微调(坐标都是归一化到0-999),训练数据格式为:
示例如下:
对应图片如下:
自定义数据量约55MB,在完成微调后,用web_demo进行推理,prompt为:
answer为:
<pt>(341,506)</pt>
表现为:
可以看到和训练数据的图标增强信息y坐标有明显偏移:'LOCATION'(341,472) ->(341,506)
这种情况多次发生,相较于返回坐标不准、数据格式不符合预期等问题,y坐标偏移格外突出,例如:
我在其他推理中(训练和未训练)都发现了这种情况,由于y坐标偏移实在明显,想询问是否有未知bug,或者训练参数不对? coco训练方式为: CUDA_VISIBLE_DEVICES=0 swift sft \ --model_type minicpm-v-v2-chat \ --dataset coco-en-2-mini \
CUDA_VISIBLE_DEVICES=0 swift export \ --ckpt_dir output/minicpm-v-v2-chat/vx-xxx/checkpoint-xxx \ --merge_lora true
自定义数据训练参数为:
ds配置为:
期望行为 | Expected Behavior
No response
复现方法 | Steps To Reproduce
No response
运行环境 | Environment
备注 | Anything else?
No response