Open zhiheng-huang opened 1 month ago
你是否还在苦恼大型语言模型的「幻觉」问题?是否希望构建自己网站或者自己需求专属的聊天机器人?是否正在寻找简单易用且准确性高的RAG模型? Denser Retriever 这款工具帮到你!
Denser Retriever是一个企业级AI检索器,旨在简化应用程序的集成,确保精确度。
我们在MTEB数据集上的实验表明,通过xgboost模型(记作ES+VS+RR_n)将关键词搜索、向量搜索和重排序器结合,可以显著提升向量搜索(VS)的基线(snowflake-arctic-embed-m模型, 在MTEB/BEIR排行榜达到了最先进的性能)。ES+VS+RR_n模型在15个MTEB数据集上达到了最高的NDCG@10得分56.47,相比snowflake模型(NDCG@10得分54.24)绝对提升了2.23,相对提升了4.11%。在广泛认可的MSMARCO基准数据集上,ES+VS+RR_n模型将snowflake模型的NDCG@10得分从41.77提升到47.23,带来了13.07%的相对提升。
我先在逛逛 github 公众号上,帮您推荐一下。后续整理到 readme 中。 预计 7.18 推文
Thanks @Wechat-ggGitHub 👍
你是否还在苦恼大型语言模型的「幻觉」问题?是否希望构建自己网站或者自己需求专属的聊天机器人?是否正在寻找简单易用且准确性高的RAG模型? Denser Retriever 这款工具帮到你!
产品简介
Denser Retriever是一个企业级AI检索器,旨在简化应用程序的集成,确保精确度。
亮点速览
表现评估
我们在MTEB数据集上的实验表明,通过xgboost模型(记作ES+VS+RR_n)将关键词搜索、向量搜索和重排序器结合,可以显著提升向量搜索(VS)的基线(snowflake-arctic-embed-m模型, 在MTEB/BEIR排行榜达到了最先进的性能)。ES+VS+RR_n模型在15个MTEB数据集上达到了最高的NDCG@10得分56.47,相比snowflake模型(NDCG@10得分54.24)绝对提升了2.23,相对提升了4.11%。在广泛认可的MSMARCO基准数据集上,ES+VS+RR_n模型将snowflake模型的NDCG@10得分从41.77提升到47.23,带来了13.07%的相对提升。