OFA-Sys / Chinese-CLIP

Chinese version of CLIP which achieves Chinese cross-modal retrieval and representation generation.
MIT License
4.38k stars 453 forks source link

文搜图的原理 #308

Open sx-zyf-123 opened 5 months ago

sx-zyf-123 commented 5 months ago

请问下这个原理是否是通过将问题转换为语义向量,然后去现有数据集中,对数据集的文本向量进行相似度匹配,然后的到相应的图片,是否能对一个随机路径下的图片集(未经过特征提取处理)进行文搜图?