hiroi-sora / Umi-OCR_v2

结束和新的开始
MIT License
915 stars 69 forks source link

文本块后处理(段落合并)实现逻辑 #20

Closed Droliven closed 8 months ago

Droliven commented 9 months ago

非常棒的项目!请问“文本块后处理(段落合并)”的实现思路是什么?相关源码在哪个地方

hiroi-sora commented 9 months ago

谢谢支持~

本项目的文本块后处理在这里: UmiOCR-data\py_src\ocr\tbpu (如果你看的是旧Release的代码,将py_src换成pyapp

如果你想更方便的观察该模块,可以去 PaddleOCR-json Python API ,其中含有完整、易用的文本后处理模块。