1Panel-dev / MaxKB

🚀 基于 LLM 大语言模型的知识库问答系统。开箱即用、模型中立、灵活编排,支持快速嵌入到第三方业务系统,1Panel 官方出品。
https://maxkb.cn/
GNU General Public License v3.0
8.4k stars 1.13k forks source link

引入其他开源PDF OCR项目用于扫描件PDF的识别 #634

Open HonorWater opened 1 month ago

HonorWater commented 1 month ago

MaxKB 版本

v1.2.0

请描述您的需求或者改进建议

首先感谢开发者开源这么好的项目! 有很多的PDF文档都是扫描件,MaxKB是无法正常识别的。

请描述你建议的实现方案

希望可以加入PDF的OCR功能,可以对PDF导入后先进行OCR识别:一般都是把PDF每一页转换为图片,然后进行识别。 可以参考这个开源项目:https://github.com/hiroi-sora/Umi-OCR 他的OCR识别效果还是很好的

附加信息

No response

baixin513 commented 1 month ago

感谢反馈,我们先调研一下。