FlagOpen / FlagEmbedding

Retrieval and Retrieval-augmented LLMs
MIT License
6.13k stars 442 forks source link

搜索引擎结合问题 #494

Open wwz0123 opened 4 months ago

wwz0123 commented 4 months ago

请问一下~

dense embedding可以结合向量库的搜索引擎,例如milvus、faiss进行使用。

那么,sparse embedding有没有什么可以推荐使用的搜索引擎或者快速检索方式和思路?

staoxiao commented 4 months ago

sparse embedding的使用方式我们也在考虑中,之前使用的是pyserini(https://github.com/FlagOpen/FlagEmbedding/tree/master/C_MTEB/MLDR#hybrid-retrieval-dense--sparse),比较繁琐。milvus等引擎有使用sparse embedding的功能,我们后续会接入。也欢迎提交PR帮助我们完善。

staoxiao commented 4 months ago

You can use the hybrid retrieval of bge-m3 following https://github.com/milvus-io/pymilvus/blob/master/examples/hello_hybrid_sparse_dense.py

wwz0123 commented 4 months ago

您可以按照以下 https://github.com/milvus-io/pymilvus/blob/master/examples/hello_hybrid_sparse_dense.py 使用 bge-m3 的混合检索

感谢,由于milvus部署有时不稳定,我已使用ES实现混合检索。