netease-youdao / BCEmbedding

Netease Youdao's open-source embedding and reranker models for RAG products.
Apache License 2.0
1.3k stars 85 forks source link

为什么匹配效果越来越差 #69

Open wensese opened 1 month ago

wensese commented 1 month ago

使用 bce-embedding-base_v1 langchain==0.1.0 milvus

刚开始向量化大概十多G文档到milvus向量数据库中,开始相似查询,文档找的很准。 使用一个月后,相似查询效果变特别差,甚至一模一样的文字都找不到。 代码没变,期间mivus 有新向量化数据进去。

不知道为什么,有人碰到这个问题吗?

shenlei1020 commented 1 month ago

看似bug,建议先小批量debug一下,然后重新刷一遍milvus的向量库