XJF2332 / GOT-OCR-2-GUI

GOT-OCR的GUI版本,提供OCR、导出PDF、批处理等功能,但不提供训练功能
Apache License 2.0
102 stars 10 forks source link

问个特别菜的问题,下载模型到底放在什么目录 #2

Closed facegbd closed 1 month ago

facegbd commented 1 month ago

我把下载的“GOT-OCR2_0”文件放在了.\GOT\model下,或者放在.\GOT\model\GOT_weights下,甚至放在主目录下。 运行 总是提示 OSError: models is not a local folder and is not a valid model identifier listed on 'https://huggingface.co/models' If this is a private repository, make sure to pass a token having permission to this repo either by logging in with huggingface-cli login or by passing token=<your_token>

此外这个gui的文件和源文件的位置关系是如何?

i-square commented 1 month ago

你看看代码就知道了:GUI-ZH_CN.py#L8

意思就是把你从huggingface下载的目录直接改名为 models,放在跟脚本同级的地方,比如脚本在 test_dir/GUI-ZH_CN.py,模型目录就是 test_dir/models

XJF2332 commented 1 month ago

models文件夹,不是model文件夹(

XJF2332 commented 1 month ago

顺便更新了一下readme,现在模型路径应该很清楚了

facegbd commented 1 month ago

感谢各位的及时帮助,昨天花了十几个小时编译flash_attn 2.6.3,虽然github有编译好的文件但是是linux系统的,我无法使用(也找到了Windows版本的,但是我也没法正确安装)。总结一下,安装和运行这些python程序的时候,主要就是解决依赖包,和正确的目录结构(再次感谢作者,在我求助之后及时的更新了软件目录结构图)。 之前安装got-ocr和got-ocr-2.0-gui失败其实都是fash_attn没有能正确安装导致的。 今天运行正确了之后,又试着在jupyter中调试,则主要遇到的是目录问题,似乎在这种交互式的运行,有一条侦测当前目录的指令不能正确执行。

由于没有编译的经验,直接按照flash_attn官方主页运行了python setup.py install,这样虽然能正确安装,但是却生成了一个egg格式的包,无法pip安装,需要使用setuptools中的eazy_install 安装,但是我试验了一下没法安装成功。必须承认,Python虽然相对简单灵活,但是也是意味着没有规则,就是一座巨大的屎山,就算引入了虚拟环境也不过是造就虚拟化屎山而已。

正常运行之后,发现不能直接处理扫描版的pdf,只能是图片。

再次感谢作者,能够正常的把图片扫描,但是无法保存输出,只能显示在结果框里。

ZhangChao1314 commented 1 month ago

同样的问题,我从百度云下载的GOT-OCR2.0文件夹,下面有benchmarks和GOT_weights目录,然后我是把GOT_weights下面的所有文件拷贝到新建的models文件夹下面,但是会有'GOT'模型无法transformer的问题,在执行conda的安装包路径下models/auto/**.py的时候报错,提示我torch或者transform out date了(目前用的torch2.4.1+cuda12.4)。我应该怎么解决呢。

XJF2332 commented 1 month ago

image image 度盘的文件和huggingface比起来少了东西,从huggingface下载,上不了huggingface的话README有写镜像站

XJF2332 commented 1 month ago

models文件夹应该是这样的 image

ZhangChao1314 commented 1 month ago

image image 度盘的文件和huggingface比起来少了东西,从huggingface下载,上不了huggingface的话README有写镜像站

确实我重新用镜像网站下载的模型文件ok了。感谢!render模式,有办法做批处理吗?而且可以加一个html转word的功能吗(找的在线转的都转换效果不是很好)?我还是需要word可编辑的一个文档。

XJF2332 commented 1 month ago

批处理暂时没有做这个功能,CLI不接受命令行参数,GUI更不用说。至于转word,你用导出的pdf转word看看,这个模型出的html格式有些特殊,我当时整转pdf都花了一些时间,直接转word估计会更麻烦😢

XJF2332 commented 1 month ago

image image 度盘的文件和huggingface比起来少了东西,从huggingface下载,上不了huggingface的话README有写镜像站

确实我重新用镜像网站下载的模型文件ok了。感谢!render模式,有办法做批处理吗?而且可以加一个html转word的功能吗(找的在线转的都转换效果不是很好)?我还是需要word可编辑的一个文档。

批处理已经做出来了,请查看README里关于Renderer.py的描述