请问，【文本后处理】中的【段落合并】是使用什么方法实现的呢？

hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片，PDF文档识别，排除水印/页眉页脚，扫描/生成二维码。内置多国语言库。

MIT License

27.59k stars 2.77k forks source link

Closed Thunderltx closed 11 months ago

Thunderltx commented 1 year ago

想知道具体的方法，因为我现在用PP的OCR出来的文本只会划块儿，没有段落

hiroi-sora commented 1 year ago

PaddleOCR-json 的Python API中有独立的段落合并模块，详见使用手册。

这是从Umi-OCR中分离出来的模块。你可以直接拿去用哦~

Thunderltx commented 12 months ago

PaddleOCR-json 的Python API中有独立的段落合并模块，详见使用手册。

这是从Umi-OCR中分离出来的模块。你可以直接拿去用哦~

谢谢告知，感谢感谢