hiroi-sora / Umi-OCR_v2

结束和新的开始
MIT License
933 stars 73 forks source link

大佬 v2可以设置像V1那样无就是无吗 #1

Closed lhj5426 closed 1 year ago

lhj5426 commented 1 year ago

image 大佬你好 试了下 v2 发现个小改动很不舒服 就是 这个输出无的时候 还能按照原来的 无输出么 为什么呢 image 我是用来 处理硬字幕 扫空图的 V1的时候全扫一遍之后 用按大小排序分组的方式 因为V1扫空可以直接生成一个0K的文档 这样通过 按文件大小分组 可以 快速筛选出 来没有字幕的图 而且软件有个功能 可以 左右 互相选择同名且不限制后缀的 相同文件名的文件 这样我可以用 右侧的 扫除来的 空字节文档 一键反选 左边的 同名 图片 这样 就把 空字幕的图片筛选出来了 而今天用了下V2 V2这个改动 无不再是生成一个0K的文档 而是多了一段提示 导致 不是0K 无法通过 按大小排序 进行确认了 无法筛选出来图片了 哈哈 所以 就来发个 议题 来说一下 这个改动 可以 设置一下还是 生成0K的文档吗

实际上这个 0K 的文档 比 写温馨提示 更具有作用

hiroi-sora commented 1 year ago

感谢提醒,你说得有道理,确实可能原来更好。我后续会改回来。

目前,你可以通过下列操作恢复原来的空输出:

  1. 打开 软件目录/UmiOCR-data/pyapp/ocr/output
  2. 用记事本打开 output_txt_individual.py
  3. 找到第18行,将原文: textOut += "[Notice] No Text. \n【通知】图片中未找到文字。\n" 改为: textOut += "" 注意不要改变语句前的空格数量。
  4. 重新启动Umi-OCR,测试效果。
lhj5426 commented 1 year ago

感谢提醒,你说得有道理,确实可能原来更好。我后续会改回来。

目前,你可以通过下列操作恢复原来的空输出:

  1. 打开 软件目录/UmiOCR-data/pyapp/ocr/output
  2. 用记事本打开 output_txt_individual.py
  3. 找到第18行,将原文: textOut += "[Notice] No Text. \n【通知】图片中未找到文字。\n" 改为: textOut += "" 注意不要改变语句前的空格数量。
  4. 重新启动Umi-OCR,测试效果。

感谢大佬 我去按照您说的试试 image 嗯 再次感谢 这样修改完 输出是0KB的文档了

lhj5426 commented 1 year ago

感谢提醒,你说得有道理,确实可能原来更好。我后续会改回来。

目前,你可以通过下列操作恢复原来的空输出:

  1. 打开 软件目录/UmiOCR-data/pyapp/ocr/output
  2. 用记事本打开 output_txt_individual.py
  3. 找到第18行,将原文: textOut += "[Notice] No Text. \n【通知】图片中未找到文字。\n" 改为: textOut += "" 注意不要改变语句前的空格数量。
  4. 重新启动Umi-OCR,测试效果。

大佬还有个问题 image

识别完 是 原始文件名.原始扩展名.txt

image 我xi修改了这里的扩展 变成 了 左边的这个样子 能不能 识别结果是 原始文件名.txt 而不是 原始文件名.原始扩展名.txt 这样套娃

哈哈我现在这样修改 直接输出的结果把我要OCR的图片都替换了哈哈 image 实在是不知道怎么改呀 还请大佬 出手

hiroi-sora commented 1 year ago

当然可以,先去除原本的后缀(如.png),然后加上自己的后缀(.txt)即可。

在文件开头加上:

import os

将原本的path = res["path"] + ".txt" 去掉,换成:

        path, extension = os.path.splitext(res["path"])  # 截取不含后缀的内容
        path = path + ".txt"  # 加上新的后缀

image image

lhj5426 commented 1 year ago

当然可以,先去除原本的后缀(如.png),然后加上自己的后缀(.txt)即可。

在文件开头加上:

import os

将原本的path = res["path"] + ".txt" 去掉,换成:

        path, extension = os.path.splitext(res["path"])  # 截取不含后缀的内容
        path = path + ".txt"  # 加上新的后缀

image image

image 大佬现在 按您给的这么写之后 运行不会生成TXT了

hiroi-sora commented 1 year ago

哈哈哈哈,典中典之空格位数不对 🤣

image

多了四个空格。这两行应该跟下面的with对齐。

lhj5426 commented 1 year ago

哈哈哈哈,典中典之空格位数不对 🤣

image

多了四个空格。这两行应该跟下面的with对齐。

image 还真是 空格 的锅 谢谢大佬 了

lhj5426 commented 1 year ago

哈哈哈哈,典中典之空格位数不对 🤣 image 多了四个空格。这两行应该跟下面的with对齐。

image 还真是 空格 的锅 谢谢大佬 了

这样就可以用同名文件名 忽略扩展名 搜到到了 非常感谢 image