opconty / pytorch_ctpn

This is a pytorch implementation of CTPN(Detecting Text in Natural Image with Connectionist Text Proposal Network). You may want to finetune from: https://drive.google.com/open?id=1JHhI4sEIXfs5gDa1I9AgJBY477HTzAd0
https://mp.weixin.qq.com/s/VO42GzwwJBOabpPJOWVn4g
291 stars 123 forks source link

请问使用的数据集图片尺寸是多少呢,predict失败,无文本框 #32

Open gxxie opened 4 years ago

gxxie commented 4 years ago

找不到原数据集就使用了ICDAR2013,由于原尺寸跑这个代码会oom,因此做了resize成640*480。train之后达到这个水准,ctpn_ep18_0.0710_0.1520_0.2228.pth.tar。 接下来使用图片进行predict时,输出没有文本框,代码中print(text)输出为[ ](空?)。是否训练失败,检测不到文本框?也许跟数据集图片尺寸有关

gxxie commented 4 years ago

即便使用提供的ctpn_keras_weights.pth.tar,文本框依旧是[ ],请问是我漏了某个地方需要修改吗

opconty commented 4 years ago

@xieguoxuan 我想跟你resize的方式有关系,有没有将test使用的图像也使用同样的resize方式试试

gxxie commented 4 years ago

@xieguoxuan 我想跟你resize的方式有关系,有没有将test使用的图像也使用同样的resize方式试试

有的,resize我是把train和test的一起了,都是640480。如果是resize的问题,那请问你发的那个ctpn_keras_weights可以直接用来做predict吗,那个predict也是没有出现结果。不管是640480还是原始图片大小我都试过。

opconty commented 4 years ago

ctpn_keras_weights不能直接predict,只是用来finetune的时候收敛快很多。之前也有感兴趣的好友用过没啥问题呀

gxxie commented 4 years ago

ctpn_keras_weights不能直接predict,只是用来finetune的时候收敛快很多。之前也有感兴趣的好友用过没啥问题呀

那请问您有训练好的weight吗,我想测试一下看看是代码没调好还是说我训练部分有问题。可以麻烦您发到 gxxiee@vip.qq.com吗

gxxie commented 4 years ago

ctpn_keras_weights不能直接predict,只是用来finetune的时候收敛快很多。之前也有感兴趣的好友用过没啥问题呀

大佬,我使用您给的pretrain_weight训练到50个epoch到ctpn_ep51_0.0185_0.0146_0.0331.pth.tar。 loss基本就不下降了,维持在0.03+。 这回出现文本框了,那就是之前的loss太大完全检测不到文本,但是现在效果非常差还是,基本没用。。结果如下 QQ图片20200507233842

请问我应该如何调整呢,是resize的图片640*480太小吗还是对lr调整呢

gxxie commented 4 years ago

ctpn_keras_weights不能直接predict,只是用来finetune的时候收敛快很多。之前也有感兴趣的好友用过没啥问题呀 测试了很多图片,经常是只能检测到一串英文的第一个字符,不知道为什么,loss降到0.3左右就没法下降了,最小就在0.28,我将lr增大了数十倍也没有用

opconty commented 4 years ago

@xieguoxuan 尝试将lr减小,不能增大