XJF2332 / GOT-OCR-2-GUI

GOT-OCR的GUI版本
Apache License 2.0
11 stars 1 forks source link

GOT-OCR-2-GUI

See English version here

img.png

关于此项目

模型权重:https://hf-mirror.com/stepfun-ai/GOT-OCR2_0

原Github:https://github.com/Ucas-HaoranWei/GOT-OCR2.0/

感谢GLM4提供的一部分代码(因为本人实在是菜,所以不得不用一下AI)

其实CLI的开发比GUI还要慢,不过我现在打算先把GUI的改动同步到CLI,然后先更新CLI,等CLI稳定后再更新GUI

点个star吧

转换为pdf已在GUI-ZH_CNGUI-EN中可用,CLI中暂不可用

使用方法

如果这里面提到的文件夹你没有,那就新建一个

依赖

使用pip安装

  • gradio
  • transformers
  • pdfkit
  • beautifulsoup4

    其他

  • wkhtmltopdf,下载压缩包,解压放进wkhtmltopdf文件夹中
  • 文件结构应该是:
    GOT-OCR-2-GUI
    ├─wkhtmltopdf
    │  ├─bin
    │  │  ├─wkhtmltopdf.exe
    │  │  ├─wkhtmltox.dll
    │  │  ├─libwkhtmltox.a
    │  │  └─wkhtmltoimage.exe
    │  └─include
    │     └─wkhtmltox
    │        └─...

下载模型文件

  1. 下载到models文件夹中
  2. 别少下载文件了
    • 文件结构应该是:
      GOT-OCR-2-GUI
      ├─models
      │  ├─model.safetensors
      │  ├─config.json
      │  └─你在huggingface下载的其他文件
      ├─CLI-EN.py
      ├─GUI-ZH_CN.py
      ├─GUI-EN.py
      └─...

      开始使用

  3. 选一个你喜欢的脚本打开
  4. 用GUI的可以不管,不过用CLI的各位记得把要OCR的图放进imgs文件夹里(CLI目前只检测.jpg.png图片)

其他