Open gxxie opened 4 years ago
即便使用提供的ctpn_keras_weights.pth.tar,文本框依旧是[ ],请问是我漏了某个地方需要修改吗
@xieguoxuan 我想跟你resize的方式有关系,有没有将test使用的图像也使用同样的resize方式试试
@xieguoxuan 我想跟你resize的方式有关系,有没有将test使用的图像也使用同样的resize方式试试
有的,resize我是把train和test的一起了,都是640480。如果是resize的问题,那请问你发的那个ctpn_keras_weights可以直接用来做predict吗,那个predict也是没有出现结果。不管是640480还是原始图片大小我都试过。
ctpn_keras_weights不能直接predict,只是用来finetune的时候收敛快很多。之前也有感兴趣的好友用过没啥问题呀
ctpn_keras_weights不能直接predict,只是用来finetune的时候收敛快很多。之前也有感兴趣的好友用过没啥问题呀
那请问您有训练好的weight吗,我想测试一下看看是代码没调好还是说我训练部分有问题。可以麻烦您发到 gxxiee@vip.qq.com吗
ctpn_keras_weights不能直接predict,只是用来finetune的时候收敛快很多。之前也有感兴趣的好友用过没啥问题呀
大佬,我使用您给的pretrain_weight训练到50个epoch到ctpn_ep51_0.0185_0.0146_0.0331.pth.tar。 loss基本就不下降了,维持在0.03+。 这回出现文本框了,那就是之前的loss太大完全检测不到文本,但是现在效果非常差还是,基本没用。。结果如下
请问我应该如何调整呢,是resize的图片640*480太小吗还是对lr调整呢
ctpn_keras_weights不能直接predict,只是用来finetune的时候收敛快很多。之前也有感兴趣的好友用过没啥问题呀 测试了很多图片,经常是只能检测到一串英文的第一个字符,不知道为什么,loss降到0.3左右就没法下降了,最小就在0.28,我将lr增大了数十倍也没有用
@xieguoxuan 尝试将lr减小,不能增大
找不到原数据集就使用了ICDAR2013,由于原尺寸跑这个代码会oom,因此做了resize成640*480。train之后达到这个水准,ctpn_ep18_0.0710_0.1520_0.2228.pth.tar。 接下来使用图片进行predict时,输出没有文本框,代码中print(text)输出为[ ](空?)。是否训练失败,检测不到文本框?也许跟数据集图片尺寸有关