Open HonorWater opened 4 months ago
v1.2.0
首先感谢开发者开源这么好的项目! 有很多的PDF文档都是扫描件,MaxKB是无法正常识别的。
希望可以加入PDF的OCR功能,可以对PDF导入后先进行OCR识别:一般都是把PDF每一页转换为图片,然后进行识别。 可以参考这个开源项目:https://github.com/hiroi-sora/Umi-OCR 他的OCR识别效果还是很好的
No response
感谢反馈,我们先调研一下。
MaxKB 版本
v1.2.0
请描述您的需求或者改进建议
首先感谢开发者开源这么好的项目! 有很多的PDF文档都是扫描件,MaxKB是无法正常识别的。
请描述你建议的实现方案
希望可以加入PDF的OCR功能,可以对PDF导入后先进行OCR识别:一般都是把PDF每一页转换为图片,然后进行识别。 可以参考这个开源项目:https://github.com/hiroi-sora/Umi-OCR 他的OCR识别效果还是很好的
附加信息
No response