OCR截图识别字符末尾有多余的换行

hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片，PDF文档识别，排除水印/页眉页脚，扫描/生成二维码。内置多国语言库。

MIT License

27.14k stars 2.72k forks source link

Closed shfujim closed 9 months ago

shfujim commented 10 months ago

请教下：在cmd中输入

Details

@echo off set work_path=C:\Umi-OCR_Paddle_v2.0.1 cd %work_path% for /R . %%s in (*.jpg) do (Umi-OCR.exe --path echo %%s -->>opt.txt) pause

依次读取当前目录下的jpg并识别，识别结果依次输出到txt或csv文件，这个文件有额外的空行。请教这个在哪里可以设置？

Snipaste_2024-01-02_19-43-59

hiroi-sora commented 10 months ago

按理说 -->> 指令是不会添加多余空行的。我这边测试也是没有空行。

你试试不要用脚本，先单张手动调用Umi-OCR.exe --path xxx -->>opt.txt，看看生成的文件是否正常？

shfujim commented 10 months ago

Snipaste_2024-01-02_21-35-01 Snipaste_2024-01-02_21-35-17 Snipaste_2024-01-02_21-35-29 是不是我设别的图片的原因？ D305

hiroi-sora commented 10 months ago

软件面板，截图OCR的设置中，段落合并是什么项？如果是 多行-代码段的话，请调回单行试试？