chatchat-space / Langchain-Chatchat

Langchain-Chatchat(原Langchain-ChatGLM)基于 Langchain 与 ChatGLM, Qwen 与 Llama 等语言模型的 RAG 与 Agent 应用 | Langchain-Chatchat (formerly langchain-ChatGLM), local knowledge based LLM (like ChatGLM, Qwen and Llama) RAG and Agent app with langchain
Apache License 2.0
31.21k stars 5.44k forks source link

[FEATURE] 使用 PDF 作为本地知识库时,对话中显示 PDF 页号 #1400

Closed yulangz closed 11 months ago

yulangz commented 1 year ago

功能描述 / Feature Description 在使用 PDF 作为本地知识库时,问答的时候是否可以给出出处的 PDF 页号,如 chatpdf 那样。

解决的问题 / Problem Solved 在对话是定位出处可以更加方便。

实现建议 / Implementation Suggestions 在语料切分的时候,带上 PDF 页号信息,并让模型在输出的时候带上页号信息。

替代方案 / Alternative Solutions

其他信息 / Additional Information

zRzRzRzRzRzRzR commented 11 months ago

收到建议, 目前,语料切分并没有针对不同的类型进行切分(csv除外) 我们开设了自定义分词器,可以让用户根据自己的需求切分 我们将尽量满足各位开发者的要求,感谢您的支持