willard-yuan / flask-keras-cnn-image-retrieval

🚀CNN-based image retrieval built on Keras
517 stars 175 forks source link

后续有考虑优化吗? #18

Closed zecynx closed 6 years ago

zecynx commented 6 years ago

感谢整理分享的论文! 看了下您的实现,用VGG16提取特征,把两张图片的点积作为相似分数,后续有考虑优化吗?

willard-yuan commented 6 years ago

特征优化需要结合特定的数据以及任务来做,使得优化的模型不具备普适性。您指的后续优化,希望是哪些方面?

zecynx commented 6 years ago

因为现在的实现是将全部特征都丢到内存里,对于数据量大肯定是不适用的。 比如:

willard-yuan commented 6 years ago

@Jjjeaswn 索引这块优化有很多方法,我在我的博客里面介绍过非常多的优化方法。至于为什么没在这个里面做优化,主要出于两点考虑:

另外,索引这一块,其实除了用faiss开源的解决方案,也有一套不依赖任何第三方的实现opq,其实是非常好的,再结合上HNSW,可以把整个索引做成HNSW+OPQ的方式,可以支持千亿图片的索引。

willard-yuan commented 6 years ago

如果没其他的问题,我先把issue先关了,有问题你再打开。