Open wangyf8848 opened 7 months ago
作者您好!请问网络架构中最初的文本编码器是使用的什么预训练模型?这个文本编码器和图像编码器之前有经过对齐训练吗?
我觉得是ImageBind的text encoder,在OpenLLAMAPEFTModel类里应该能找到相关代码
作者您好!请问网络架构中最初的文本编码器是使用的什么预训练模型?这个文本编码器和图像编码器之前有经过对齐训练吗?