Closed qwer666qwer closed 2 months ago
感谢提出,这是P2T输出项不标准导致的异常。你可以手动更新代码修复该bug:
打开 UmiOCR-data\py_src\ocr\tbpu\parser_tools\line_preprocessing.py
第85行 linePreprocessing
函数的后面,添加一行代码:
def linePreprocessing(textBlocks):
textBlocks = [i for i in textBlocks if i.get("text", False)]
如图:
下个版本将更新此bug修复。
谢谢大佬修复
Issues
Umi-OCR version 程序版本
2.1.3和2.1.2都测试过
Windows version 系统版本
win11
OCR plugins Used 使用的OCR插件
Pix2Text
Reproduction steps 复现步骤
如图,ocr该书的过程中卡住,等了很久也没反应。cli中的报错是:
Problem screenshots or related files (optional) 问题截图或相关文件(可选)
测度论与概率论基础 (程士宏编著) (Z-Library).pdf