Open xuyiming010912 opened 1 month ago
Me too
我在2400+对图文定位数据集上做基于Lora的微调,效果很差,完全找不到图片目标和文本得对应关系,我也试着调整--fix-vit参数,但也没用,效果依旧很差。有大佬知道如何应对吗?
预训练模型用的哪个,应该是vl-chat 效果,数据量 跟任务难度又有关系。 主要还是看loss下降情况进行分析。
个人见解
找到原因了,训练时候用错模型了,用的量化的,合并的时候跟chat的合并的,导致于一系列的错误,但是检测框精度不是很高,泛化能力不是很大
---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2024年06月13日 14:50 | | 收件人 | @.> | | 抄送至 | @.>@.> | | 主题 | Re: [QwenLM/Qwen-VL] 💡 [REQUEST] -
预训练模型用的哪个,应该是vl-chat 效果,数据量 跟任务难度又有关系。 主要还是看loss下降情况进行分析。
个人见解
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>
我也正在摸索,可交流Q 294813364
有微信吗?QQ不常用
---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2024年06月13日 14:58 | | 收件人 | @.> | | 抄送至 | @.>@.> | | 主题 | Re: [QwenLM/Qwen-VL] 💡 [REQUEST] -
我也正在摸索,可交流Q 294813364
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>
dcsun001
好的,备注是徐一鸣
---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2024年06月13日 15:03 | | 收件人 | @.> | | 抄送至 | @.>@.> | | 主题 | Re: [QwenLM/Qwen-VL] 💡 [REQUEST] -
dcsun001
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>
起始日期 | Start Date
No response
实现PR | Implementation PR
No response
相关Issues | Reference Issues
No response
摘要 | Summary
训练过程中learning_rate一直不变
基本示例 | Basic Example
1
缺陷 | Drawbacks
1
未解决问题 | Unresolved questions
1