构建的知识库能不能按指定文件夹的方式上传，还有匹配到知识库给出建议时可否带上上下文文档出处

jia-zhen-yu commented 7 months ago

知识库文档能不能添加、删除、最多能支持多大的文档

caihengsheng commented 7 months ago

我加了7个PDF大文档，非常耗时，似乎上下文检索不到一些信息。

sugarforever commented 7 months ago

我加了7个PDF大文档，非常耗时，似乎上下文检索不到一些信息。

7个文档共计有多大？数据处理需要完成分片，向量化，并存储，这个过程是主要耗时的阶段。

当前的RAG实现还是比较基础的，所以检索质量还有很大提升空间。我们会持续改进。

caihengsheng commented 7 months ago

我7个PDF文件都是中文文档见附件，聊天时回答问题似乎并没提取书记库内容？是否向量化中文有问题？

On Mon, Mar 18, 2024 at 1:07 PM sugarforever @.***> wrote:

我加了7个PDF大文档，非常耗时，似乎上下文检索不到一些信息。

7个文档共计有多大？数据处理需要完成分片，向量化，并存储，这个过程是主要耗时的阶段。

当前的RAG实现还是比较基础的，所以检索质量还有很大提升空间。我们会持续改进。

— Reply to this email directly, view it on GitHub https://github.com/sugarforever/chat-ollama/issues/76#issuecomment-2004476927, or unsubscribe https://github.com/notifications/unsubscribe-auth/AXHCZ5IA27HZVSAGFEFCJDDYY4NMLAVCNFSM6AAAAABEY32WK2VHI2DSMVQWIX3LMV43OSLTON2WKQ3PNVWWK3TUHMZDAMBUGQ3TMOJSG4 . You are receiving this because you commented.Message ID: @.***>

-- Hengsheng Cai

bend2046 commented 6 months ago

聊天时没有提取文档记录，是Bug还是向量库优化问题？文档的QA方式有没有要求？

sugarforever / chat-ollama

构建的知识库能不能按指定文件夹的方式上传，还有匹配到知识库给出建议时可否带上上下文文档出处 #76