DAMO-NLP-SG / Video-LLaMA

[EMNLP 2023 Demo] Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding
BSD 3-Clause "New" or "Revised" License
2.7k stars 243 forks source link

如何提升下游任务上finetune的效果 #147

Open Jinjikiko opened 6 months ago

Jinjikiko commented 6 months ago

您好,请问按照给定的config在下游任务上进行Finetune效果不太好可能是什么原因?是否需要引入lora等方式增加可学习参数的数量以提升模型在下游任务上的效果呢? 感谢您的解答!