chatchat-space / Langchain-Chatchat

Langchain-Chatchat(原Langchain-ChatGLM)基于 Langchain 与 ChatGLM, Qwen 与 Llama 等语言模型的 RAG 与 Agent 应用 | Langchain-Chatchat (formerly langchain-ChatGLM), local knowledge based LLM (like ChatGLM, Qwen and Llama) RAG and Agent app with langchain
Apache License 2.0
31.84k stars 5.55k forks source link

知识库问答,提问同一个问题,第一次问无法回答,第二次问才能正确回答 #3817

Closed zixiaotan21 closed 6 months ago

zixiaotan21 commented 6 months ago

问题描述 / Problem Description 知识库问答,提问同一个问题,第一次问无法回答,第二次问,或者多次提问之后,才能正确回答 使用的是Qwen-14B模型,在本地部署,是大模型推理能力问题导致的吗?

复现问题的步骤 / Steps to Reproduce

9abf5efc967a9dcbefac6de9d939faf 6a565e6bc6e6f3c120e01029d95dcf0
dosubot[bot] commented 6 months ago

当您使用Qwen-14B模型在本地部署进行知识库问答时,遇到的问题可能与模型的大规模推理能力有关。这种情况下,第一次提问无法得到回答,而多次提问后才能正确回答的现象,可能是由于模型首次加载、文档的缓存以及重新排序过程的优化等因素导致的性能不一致。为了提高效率,可能的优化措施包括搜索结果的缓存、语言模型的缓存以及提高文档处理的效率。

具体的代码实现和进一步的讨论可以在Langchain-Chatchat的GitHub页面找到。此外,以下是一些相关问题的讨论,可能对您有所帮助:

  1. 知识库问答问题,回复内容知识库已经匹配到对应内容,但是还是回复根据已知信息,无法回答该问题
  2. zhipu-api轻量版本,知识库问答报错‘未找到相关文档,该回答为大模型自身能力解答!’
  3. 使用BaiChuan13B进行知识库问答,模型不回答或者答非所问

如果您有任何其他问题或需要进一步的澄清,请随时告诉我。

Sources

#### About Dosu This response is meant to be useful and save you time. It is **not meant to be a precise solution**, but rather a starting point for your own research. Help me be more useful! Please leave a 👍 if this is helpful and 👎 if it is irrelevant. If you want to continue the conversation, start your reply with @dosu-bot.
zRzRzRzRzRzRzR commented 6 months ago

可能你问的太快了,第一次需要启动embed模型