模型权重:https://hf-mirror.com/stepfun-ai/GOT-OCR2_0
原Github:https://github.com/Ucas-HaoranWei/GOT-OCR2.0/
感谢GLM4提供的一部分代码(因为本人实在是菜,所以不得不用一下AI)
其实CLI的开发比GUI还要慢,不过我现在打算先把GUI的改动同步到CLI,然后先更新CLI,等CLI稳定后再更新GUI
点个star吧
GUI-ZH_CN
和GUI-EN
中可用,CLI中暂不可用如果这里面提到的文件夹你没有,那就新建一个
依赖
使用
pip
安装
- gradio
- transformers
- pdfkit
- beautifulsoup4
其他
- wkhtmltopdf,下载压缩包,解压放进
wkhtmltopdf
文件夹中- 文件结构应该是:
GOT-OCR-2-GUI ├─wkhtmltopdf │ ├─bin │ │ ├─wkhtmltopdf.exe │ │ ├─wkhtmltox.dll │ │ ├─libwkhtmltox.a │ │ └─wkhtmltoimage.exe │ └─include │ └─wkhtmltox │ └─...
models
文件夹中GOT-OCR-2-GUI
├─models
│ ├─model.safetensors
│ ├─config.json
│ └─你在huggingface下载的其他文件
├─CLI-EN.py
├─GUI-ZH_CN.py
├─GUI-EN.py
└─...
imgs
文件夹里(CLI目前只检测.jpg
和.png
图片)tests
文件夹中的内容cmd
跑python +文件名
,我自己测试时会出现闪退的情况,我也不知道为什么