Open jia-zhen-yu opened 7 months ago
我加了7个PDF大文档,非常耗时,似乎上下文检索不到一些信息。
我加了7个PDF大文档,非常耗时,似乎上下文检索不到一些信息。
7个文档共计有多大?数据处理需要完成分片,向量化,并存储,这个过程是主要耗时的阶段。
当前的RAG实现还是比较基础的,所以检索质量还有很大提升空间。我们会持续改进。
我7个PDF文件都是中文文档见附件,聊天时回答问题似乎并没提取书记库内容?是否向量化中文有问题?
On Mon, Mar 18, 2024 at 1:07 PM sugarforever @.***> wrote:
我加了7个PDF大文档,非常耗时,似乎上下文检索不到一些信息。
7个文档共计有多大?数据处理需要完成分片,向量化,并存储,这个过程是主要耗时的阶段。
当前的RAG实现还是比较基础的,所以检索质量还有很大提升空间。我们会持续改进。
— Reply to this email directly, view it on GitHub https://github.com/sugarforever/chat-ollama/issues/76#issuecomment-2004476927, or unsubscribe https://github.com/notifications/unsubscribe-auth/AXHCZ5IA27HZVSAGFEFCJDDYY4NMLAVCNFSM6AAAAABEY32WK2VHI2DSMVQWIX3LMV43OSLTON2WKQ3PNVWWK3TUHMZDAMBUGQ3TMOJSG4 . You are receiving this because you commented.Message ID: @.***>
-- Hengsheng Cai
聊天时没有提取文档记录,是Bug还是向量库优化问题?文档的QA方式有没有要求?
知识库文档能不能添加、删除、最多能支持多大的文档