GOT-OCR-2-GUI

See English version here

关于此项目

模型权重：https://hf-mirror.com/stepfun-ai/GOT-OCR2_0

原Github：https://github.com/Ucas-HaoranWei/GOT-OCR2.0/

感谢GLM4提供的一部分代码（因为本人实在是菜，所以不得不用一下AI）

其实CLI的开发比GUI还要慢，不过我现在打算先把GUI的改动同步到CLI，然后先更新CLI，等CLI稳定后再更新GUI

点个star吧

转换为pdf已在`GUI-ZH_CN`和`GUI-EN`中可用，CLI中暂不可用

使用方法

如果这里面提到的文件夹你没有，那就新建一个

依赖

使用pip安装
gradio

transformers

pdfkit

beautifulsoup4
其他

wkhtmltopdf，下载压缩包，解压放进wkhtmltopdf文件夹中
文件结构应该是：
GOT-OCR-2-GUI
├─wkhtmltopdf
│  ├─bin
│  │  ├─wkhtmltopdf.exe
│  │  ├─wkhtmltox.dll
│  │  ├─libwkhtmltox.a
│  │  └─wkhtmltoimage.exe
│  └─include
│     └─wkhtmltox
│        └─...

下载模型文件

下载到models文件夹中

别少下载文件了

文件结构应该是：

GOT-OCR-2-GUI
├─models
│  ├─model.safetensors
│  ├─config.json
│  └─你在huggingface下载的其他文件
├─CLI-EN.py
├─GUI-ZH_CN.py
├─GUI-EN.py
└─...

开始使用

选一个你喜欢的脚本打开
用GUI的可以不管，不过用CLI的各位记得把要OCR的图放进imgs文件夹里（CLI目前只检测.jpg和.png图片）

其他

非必要不需要用tests文件夹中的内容
脚本闪退的话可以试一下用cmd跑python +文件名，我自己测试时会出现闪退的情况，我也不知道为什么

XJF2332 / GOT-OCR-2-GUI

readme

GOT-OCR-2-GUI

See English version here

关于此项目

转换为pdf已在`GUI-ZH_CN`和`GUI-EN`中可用，CLI中暂不可用

使用方法

依赖

使用`pip`安装

其他

下载模型文件

开始使用

其他

XJF2332 / GOT-OCR-2-GUI

readme

GOT-OCR-2-GUI

See English version here

关于此项目

转换为pdf已在GUI-ZH_CN和GUI-EN中可用，CLI中暂不可用

使用方法

依赖

使用pip安装

其他

下载模型文件

开始使用

其他

转换为pdf已在`GUI-ZH_CN`和`GUI-EN`中可用，CLI中暂不可用

使用`pip`安装