hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
27.59k stars 2.77k forks source link

请问,【文本后处理】中的【段落合并】是使用什么方法实现的呢? #249

Closed Thunderltx closed 11 months ago

Thunderltx commented 1 year ago

想知道具体的方法,因为我现在用PP的OCR出来的文本只会划块儿,没有段落

hiroi-sora commented 1 year ago

PaddleOCR-json 的Python API中有独立的段落合并模块,详见 使用手册

这是从Umi-OCR中分离出来的模块。你可以直接拿去用哦~

Thunderltx commented 12 months ago

PaddleOCR-json 的Python API中有独立的段落合并模块,详见 使用手册

这是从Umi-OCR中分离出来的模块。你可以直接拿去用哦~

谢谢告知,感谢感谢