sugarforever / chat-ollama

ChatOllama is an open source chatbot based on LLMs. It supports a wide range of language models, and knowledge base management.
MIT License
2.62k stars 409 forks source link

构建的知识库能不能按指定文件夹的方式上传,还有匹配到知识库给出建议时可否带上上下文文档出处 #76

Open jia-zhen-yu opened 7 months ago

jia-zhen-yu commented 7 months ago

知识库文档能不能添加、删除、最多能支持多大的文档

caihengsheng commented 7 months ago

我加了7个PDF大文档,非常耗时,似乎上下文检索不到一些信息。

sugarforever commented 7 months ago

我加了7个PDF大文档,非常耗时,似乎上下文检索不到一些信息。

7个文档共计有多大?数据处理需要完成分片,向量化,并存储,这个过程是主要耗时的阶段。

当前的RAG实现还是比较基础的,所以检索质量还有很大提升空间。我们会持续改进。

caihengsheng commented 7 months ago

我7个PDF文件都是中文文档见附件,聊天时回答问题似乎并没提取书记库内容?是否向量化中文有问题?

On Mon, Mar 18, 2024 at 1:07 PM sugarforever @.***> wrote:

我加了7个PDF大文档,非常耗时,似乎上下文检索不到一些信息。

7个文档共计有多大?数据处理需要完成分片,向量化,并存储,这个过程是主要耗时的阶段。

当前的RAG实现还是比较基础的,所以检索质量还有很大提升空间。我们会持续改进。

— Reply to this email directly, view it on GitHub https://github.com/sugarforever/chat-ollama/issues/76#issuecomment-2004476927, or unsubscribe https://github.com/notifications/unsubscribe-auth/AXHCZ5IA27HZVSAGFEFCJDDYY4NMLAVCNFSM6AAAAABEY32WK2VHI2DSMVQWIX3LMV43OSLTON2WKQ3PNVWWK3TUHMZDAMBUGQ3TMOJSG4 . You are receiving this because you commented.Message ID: @.***>

-- Hengsheng Cai

bend2046 commented 6 months ago

聊天时没有提取文档记录,是Bug还是向量库优化问题?文档的QA方式有没有要求?