Open hjgw opened 5 years ago
我这边大概一个epoch loss就开始下降,大概4,5个epoch开始收敛
嗯嗯,我再调调程序,谢谢~
我用自己的数据,train loss 跑一个晚上,大概到 0.07,但 infer 的效果看起来一般
@leonzhu211 是不是recall较好,precision较差?我不知道你的数据是什么样的,但是CTPN这个算法只对水平文本有较好效果
目标数据是新闻视频抽帧的新闻字幕或影视抽帧中的字幕。 数据集是自己造的。 随机取图片、字体、颜色、字号、图片中的位置 等参数,画个字到图片上,再扔给 CTPN 训练。
另外,原代码好像没有对输入做 normalize,加上了,好像也没有太大变化。 关于 scale 部分, 600 这个值,意义没看懂。 CTPN 应该是不限制图片宽高,准备取消 scale 再继续训练。
@leonzhu211 ctpn论文提到了这个600的:The input image is resized by setting its short side to 600 for training, while keeping its original aspect ratio.
@AstarLight 谢谢,查原文,果然看到了。
@AstarLight 请问如果是垂直文本应该怎么调整ctpn的参数?
训练不收敛,损失一直是0.7左右?有人遇到这个问题吗?求解决办法
训练不收敛+1....基本上跑了一整天才跑了9个epoch,求解决方法呀~~
请问一下,您是怎样切分数据集的呢?代码描述上您是使用俩个数据集,但是从csdn您的训练截图来看,您好像只使用了msra数据集?
跑了一整天才跑了3个epoch,路过
请问我的出现这个错误是什么问题呢[0/20][20/282] Loss: 42.145580
[0/20][40/282] Loss: 19.428555
[0/20][60/282] Loss: 17.523825
[0/20][80/282] Loss: 16.701580
[0/20][100/282] Loss: 16.425825
[0/20][120/282] Loss: 16.065802
[0/20][140/282] Loss: 15.806343
[0/20][160/282] Loss: 15.621722
[0/20][180/282] Loss: 15.718269
[0/20][200/282] Loss: 15.642500
[0/20][220/282] Loss: 15.453972
[0/20][240/282] Loss: 15.550603
[0/20][260/282] Loss: 15.239004
Traceback (most recent call last):
File "train.py", line 165, in
作者您好,请问一下,您训练多少个epoch开始收敛呢?我用您提供的数据集训练2个epoch还是震荡的,用您的代码转换了ICDAR2017的数据集训练,训练了7个epoch也不收敛。想问下您除了调整学习速率还有什么解决办法吗?谢谢~
你好,我也是在跑ICDAR这个数据集,我把文字都切出来了,但是尺寸都不一样大小,请问一下用作者的CRNN的时候需要怎样调整输入图像的大小呢?
作者您好,请问一下,您训练多少个epoch开始收敛呢?我用您提供的数据集训练2个epoch还是震荡的,用您的代码转换了ICDAR2017的数据集训练,训练了7个epoch也不收敛。想问下您除了调整学习速率还有什么解决办法吗?谢谢~