文搜图的原理 - Githubissues

OFA-Sys / Chinese-CLIP

Chinese version of CLIP which achieves Chinese cross-modal retrieval and representation generation.

MIT License

4.38k stars 453 forks source link

Open sx-zyf-123 opened 5 months ago

sx-zyf-123 commented 5 months ago

请问下这个原理是否是通过将问题转换为语义向量，然后去现有数据集中，对数据集的文本向量进行相似度匹配，然后的到相应的图片，是否能对一个随机路径下的图片集（未经过特征提取处理）进行文搜图？