CASIA-IVA-Lab / AnomalyGPT

[AAAI 2024 Oral] AnomalyGPT: Detecting Industrial Anomalies Using Large Vision-Language Models
https://anomalygpt.github.io
Other
773 stars 94 forks source link

不是很理解为啥微调mvtec数据的时候还需要同时训练pandagpt4_visual_instruction_data? #61

Closed plshuaishuai2 closed 8 months ago

plshuaishuai2 commented 8 months ago

pandagpt4_visual_instruction_data不是用来训练pandagpt4的么,这个模型应该只需要微调下游异常检测数据吧?为啥代码里面同时还训练pandagpt4_visual_instruction_data?

FantasticGNU commented 8 months ago

这是为了防止微调的时候大模型发生灾难性遗忘,失去其在大规模预训练数据上获得的知识。只使用下游异常检测数据容易过拟合。