OpenBMB / MiniCPM-V

MiniCPM-Llama3-V 2.5: A GPT-4V Level Multimodal LLM on Your Phone
Apache License 2.0
7.98k stars 558 forks source link

按照提供的finetune代码,微调loss为0 #204

Closed HelloWorld19930113 closed 1 month ago

HelloWorld19930113 commented 1 month ago

起始日期 | Start Date

No response

实现PR | Implementation PR

No response

相关Issues | Reference Issues

No response

摘要 | Summary

按照大佬提供的finetune_ds.sh 训练发现loss为0,不知道哪里有问题

基本示例 | Basic Example

按照大佬提供的finetune_ds.sh 训练发现loss为0,不知道哪里有问题

缺陷 | Drawbacks

按照大佬提供的finetune_ds.sh 训练发现loss为0,不知道哪里有问题

未解决问题 | Unresolved questions

No response

HelloWorld19930113 commented 1 month ago

[ { "id": "0", "image": 'path/to/image_0.jpg', "conversations": [ { 'role': 'user', 'content': '\n请识别证件照图片中的内容' }, { 'role': 'assistant', 'content': '1.公司名称:xxxx\n2.公司代码:xxxx\n3.公司地址:xxxx' } ] } ]

strawhatboy commented 1 month ago

看看是不是MODEL和LLM_TYPE 没有对应?V-2_5 对应 llama3,V-2 对应 minicpm

HelloWorld19930113 commented 1 month ago

看看是不是MODEL和LLM_TYPE 没有对应?V-2_5 对应 llama3,V-2 对应 minicpm

这个检查了没问题

HelloWorld19930113 commented 1 month ago

看看是不是MODEL和LLM_TYPE 没有对应?V-2_5 对应 llama3,V-2 对应 minicpm

已解决,感谢大佬