hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
23.05k stars 2.35k forks source link

文字与向量公式混排的时候,向量识别有误。 #493

Closed wuaijiepo closed 1 month ago

wuaijiepo commented 2 months ago

Issues

Umi-OCR version 程序版本

2.1.0

Windows version 系统版本

win10

OCR plugins Used 使用的OCR插件

Pix2Text

Reproduction steps 复现步骤

单独识别向量准确,但是文字与向量公式混排的时候,向量识别有误。 360截图20240410084424889

360截图20240427114719561

Problem screenshots or related files (optional) 问题截图或相关文件(可选)

No response

hiroi-sora commented 2 months ago

这是 Pix2Text 插件,检测模型 的精度问题。它对于行内公式的检测能力比较有限。

见: https://github.com/breezedeus/Pix2Text/issues/70

例图这种较复杂的情景,还是不要用混合识别了,手动一个个框选吧。(在设置里仅勾选 启用数学公式 ,可以提高纯公式识别的精度。)

wuaijiepo commented 2 months ago

非常感谢。