CASIA-IVA-Lab / AnomalyGPT

[AAAI 2024 Oral] AnomalyGPT: Detecting Industrial Anomalies Using Large Vision-Language Models
https://anomalygpt.github.io
Other
807 stars 100 forks source link

text encoder #83

Open wangyf8848 opened 7 months ago

wangyf8848 commented 7 months ago

作者您好!请问网络架构中最初的文本编码器是使用的什么预训练模型?这个文本编码器和图像编码器之前有经过对齐训练吗?

hxx-who commented 7 months ago

我觉得是ImageBind的text encoder,在OpenLLAMAPEFTModel类里应该能找到相关代码