Closed ChesonHuang closed 2 months ago
先占个坑(本周内填完),记录我实现应用的心得,以供需要的人参考。 为实现类似README中的应用,分为前后端的部署。
clip-retrieval里案例处理数据集是用img2dataset, 除了这种方式,你还可以自己处理数据对,保证图文匹配就行。例如:你保证你的数据集文件夹下:有 xxxx.png和xxxx.txt即可,这个xxxx是个ID,同一个图片和文本对要保证一致。
all_clip不支持chinese clip,需要手动添加支持,代码参考这里添加即可:https://github.com/data2ml/all-clip/pull/27
问题1: Can't pickle local object 'get_image_dataset..ImageDataset' 这是个多线程的问题,加上参数--num_prepro_workers=1即可 问题2: 当采用自己的图片文本对的时候,报错self.images not found key 这是bug, 参考这里的解决 办法
先占个坑(本周内填完),记录我实现应用的心得,以供需要的人参考。 为实现类似README中的应用,分为前后端的部署。
前端的部署
后端服务的部署
步骤1:数据的处理
clip-retrieval里案例处理数据集是用img2dataset, 除了这种方式,你还可以自己处理数据对,保证图文匹配就行。例如:你保证你的数据集文件夹下:有 xxxx.png和xxxx.txt即可,这个xxxx是个ID,同一个图片和文本对要保证一致。
步骤2:all_clip的改动
all_clip不支持chinese clip,需要手动添加支持,代码参考这里添加即可:https://github.com/data2ml/all-clip/pull/27
步骤3:clip_retrieval代码优化
问题1: Can't pickle local object 'get_image_dataset..ImageDataset'
这是个多线程的问题,加上参数--num_prepro_workers=1即可
问题2: 当采用自己的图片文本对的时候,报错self.images not found key
这是bug, 参考这里的解决 办法