whai362 / pan_pp.pytorch

Official implementations of PSENet, PAN and PAN++.
Apache License 2.0
435 stars 90 forks source link

can not download the pretained of resnet #83

Open kongbailongtian opened 2 years ago

kongbailongtian commented 2 years ago

感谢作者对代码的开源,目前我遇到一个问题:Resnet预训练文件通过该网址无法加载,连接超时? 在colab和本地(尝试过开启或关闭VPN)都无法成功加载 issue

imjunwei commented 2 years ago

我也遇到过,这个链接已经失效了,换成了pytorch上面下的预训练模型

kongbailongtian commented 2 years ago

我也遇到过,这个链接已经失效了,换成了pytorch上面下的预训练模型 @imjunwei 很感谢您的解答,按照这个替换成pytorch的下载链接(不知道是否正确) image 加载时出现模型参数不匹配的情况?请问您有遇到吗 image 你有完成这个模型的训练吗?大致花费了多久的时间?达到了怎么样的精度? 再次感谢您对我的问题的解答!

imjunwei commented 2 years ago

@kongbailongtian 我也是遇到这个问题,可能因为作者是多卡训练的,单卡的话要在resnet18那里加上这么一句: Screenshot from 2021-12-30 11-15-36 model = nn.DataParallel(model).cuda() 我自己用batchsize=8跑了200个epoch,效果如下: Screenshot from 2021-12-30 11-06-26 但是想测试端到端的效果的时候报错了,不知怎么回事: Screenshot from 2021-12-30 11-19-50

kongbailongtian commented 2 years ago

@imjunwei 关于您的问题,我个人觉得你应该是训练的PANNet的检测代码,所以可以顺利执行sh eval_ic15.sh 由于检测代码不包含后续文字识别部分代码,生成的标注文件也不包含文字信息,因此在测试端到端的效果是报错格式不匹配的问题,如果您想测试端到端的的效果,您应该训练包含文字识别的模型代码(PAN++) image @imjunwei 同时很感谢您的解答!问题得到了解决! 目前我在colab上的k80进行测试,batchsize=8,num_workers=2,可在内存正常进行! image 而我手上目前能拿到一块T4显卡,后续将再次申请1块,多卡训练是否也需要加这个语句? 先请教您手上是什么显卡进行训练,200个epoch需要多久时间?

imjunwei commented 2 years ago

@kongbailongtian 我确实训练的是pan++的代码,但是训练过程好像没有显示文本识别部分的loss,可能还没有加上这部分训练

imjunwei commented 2 years ago

@kongbailongtian 多卡训练应该可以去掉吧,我目前就一张显卡还没尝试过,我使用的是Titan 11G,200个大概7个钟吧

kongbailongtian commented 2 years ago

@imjunwei 很感谢您的解答!你的代码所报的错误确实是格式不匹配的问题,生成了检测的格式,但是具体的原因我并不清楚,因为我未通读代码,很抱歉