输出文本长度偏短

OpenGVLab / Ask-Anything

[CVPR2024 Highlight][VideoChatGPT] ChatGPT with video understanding! And many more supported LMs such as miniGPT4, StableLM, and MOSS.

MIT License

2.85k stars 230 forks source link

您好，我尝试使用部分数据复现video_chat2三阶段训练，3~5个epoch后loss降低，之后使用训练后的模型做推理，发现相比您Github release的stage3 model，模型输出文本长度偏短，对视频中的细节也没有刻画。
我使用的训练数据来自HuggingFace -- VideoChat2-IT，使用了除了k700之外全部的video数据，没有使用image部分的数据。
请问您在训练时有遇到过这种情况吗？有没有一些解决思路参考下呢？谢谢！

OpenGVLab / Ask-Anything

输出文本长度偏短 #134