Closed zecynx closed 6 years ago
特征优化需要结合特定的数据以及任务来做,使得优化的模型不具备普适性。您指的后续优化,希望是哪些方面?
因为现在的实现是将全部特征都丢到内存里,对于数据量大肯定是不适用的。 比如:
@Jjjeaswn 索引这块优化有很多方法,我在我的博客里面介绍过非常多的优化方法。至于为什么没在这个里面做优化,主要出于两点考虑:
另外,索引这一块,其实除了用faiss开源的解决方案,也有一套不依赖任何第三方的实现opq,其实是非常好的,再结合上HNSW,可以把整个索引做成HNSW+OPQ的方式,可以支持千亿图片的索引。
如果没其他的问题,我先把issue先关了,有问题你再打开。
感谢整理分享的论文! 看了下您的实现,用VGG16提取特征,把两张图片的点积作为相似分数,后续有考虑优化吗?