1Panel-dev / MaxKB

🚀 MaxKB 是一款基于大语言模型和 RAG 的开源知识库问答系统,广泛应用于智能客服、企业内部知识库、学术研究与教育等场景。
https://maxkb.cn/
GNU General Public License v3.0
11.33k stars 1.48k forks source link

[FEATURE]Excel类型文档导入自动切分策略 #1573

Open 2023fan opened 4 hours ago

2023fan commented 4 hours ago

MaxKB 版本

1.7

请描述您的需求或者改进建议

现状: 导入Excel文档字段信息 image 切分后的分段:所有字段信息都是在同一行

839adaf6759ba86d7189116a9de3bf6

全部在同一行,分段检索时,命中率较低。建议改成一下格式:每个字段单独一行,这样可以提升检索分段的名字率

07bb428c05c50b503a8a13a56392554

请描述你建议的实现方案

No response

附加信息

No response

baixin513 commented 2 hours ago

感谢反馈,这里分行展示也只是能方便查看,命中率不会变的。