hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
MIT License
27.14k stars 2.72k forks source link

OCR截图识别字符末尾有多余的换行 #292

Closed shfujim closed 9 months ago

shfujim commented 10 months ago

请教下: 在cmd中输入

Details

@echo off set work_path=C:\Umi-OCR_Paddle_v2.0.1 cd %work_path% for /R . %%s in (*.jpg) do (Umi-OCR.exe --path echo %%s -->>opt.txt) pause

依次读取当前目录下的jpg并识别, 识别结果依次输出到txt或csv文件,这个文件有额外的空行。请教这个在哪里可以设置?

Snipaste_2024-01-02_19-43-59

hiroi-sora commented 10 months ago

按理说 -->> 指令是不会添加多余空行的。我这边测试也是没有空行。

你试试不要用脚本,先单张手动调用Umi-OCR.exe --path xxx -->>opt.txt,看看生成的文件是否正常?

shfujim commented 10 months ago

Snipaste_2024-01-02_21-35-01 Snipaste_2024-01-02_21-35-17 Snipaste_2024-01-02_21-35-29 是不是我设别的图片的原因? D305

hiroi-sora commented 10 months ago

软件面板,截图OCR的设置中,段落合并是什么项?如果是 多行-代码段的话,请调回单行试试?