为什么匹配效果越来越差

netease-youdao / BCEmbedding

Netease Youdao's open-source embedding and reranker models for RAG products.

Apache License 2.0

1.3k stars 85 forks source link

Open wensese opened 1 month ago

wensese commented 1 month ago

使用 bce-embedding-base_v1 langchain==0.1.0 milvus

刚开始向量化大概十多G文档到milvus向量数据库中，开始相似查询，文档找的很准。使用一个月后，相似查询效果变特别差，甚至一模一样的文字都找不到。代码没变，期间mivus 有新向量化数据进去。

不知道为什么，有人碰到这个问题吗？

shenlei1020 commented 1 month ago

看似bug，建议先小批量debug一下，然后重新刷一遍milvus的向量库