OFA-Sys / Chinese-CLIP

Chinese version of CLIP which achieves Chinese cross-modal retrieval and representation generation.
MIT License
4.01k stars 418 forks source link

Delete #304

Closed ChesonHuang closed 2 months ago

ChesonHuang commented 2 months ago

先占个坑(本周内填完),记录我实现应用的心得,以供需要的人参考。 为实现类似README中的应用,分为前后端的部署。

前端的部署

后端服务的部署

步骤1:数据的处理

clip-retrieval里案例处理数据集是用img2dataset, 除了这种方式,你还可以自己处理数据对,保证图文匹配就行。例如:你保证你的数据集文件夹下:有 xxxx.png和xxxx.txt即可,这个xxxx是个ID,同一个图片和文本对要保证一致。

步骤2:all_clip的改动

all_clip不支持chinese clip,需要手动添加支持,代码参考这里添加即可:https://github.com/data2ml/all-clip/pull/27

步骤3:clip_retrieval代码优化

问题1: Can't pickle local object 'get_image_dataset..ImageDataset' 这是个多线程的问题,加上参数--num_prepro_workers=1即可 问题2: 当采用自己的图片文本对的时候,报错self.images not found key 这是bug, 参考这里的解决 办法