PaddlePaddle / PaddleOCR

Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)
https://paddlepaddle.github.io/PaddleOCR/
Apache License 2.0
43.02k stars 7.72k forks source link

用横排竖排都有的数据集训练pgnet时,ctc_loss无法收敛。 #2945

Closed lzzzzj closed 3 years ago

lzzzzj commented 3 years ago

ctc_loss一直保持开始的水平,在40~60之间波动 横排检测的效果尚可,竖排很差 识别的效果横竖都很差 是需要对竖排文本做一些处理吗?训练和预测时分别需要怎么做呢? (数据集大部分为横排,小部分为竖排)

LDOUBLEV commented 3 years ago

你的竖排数据label是不是对的,另外可以check下训练数据生成的label ,比如竖排的文字方向TDO是不是对的;也可以可视化看下竖排文本的特征,对竖排文本有没有响应。

你用的是哪个数据集,识别的字符有多少个,

LDOUBLEV commented 3 years ago

另外要注意的是坐标点的顺序,横排的pgnet的点顺序是从左到右,竖排文字的坐标顺序可能会不太一样

lzzzzj commented 3 years ago

标签和点的顺序都没有问题 请问ctc_loss不收敛还有别的可能的原因吗,多次修改过一些参数都没有什么改善

lqniunjunlper commented 3 years ago

@lzzzzj 遇到同样的问题 如何解决?竖排的label坐标如何设置比较好?

lzzzzj commented 3 years ago

@lzzzzj 遇到同样的问题 如何解决?竖排的label坐标如何设置比较好?

标点按理来说也是从左上开始顺时针即可,但是我最后效果还是比较差,你可以试一试

tjpulfn commented 3 years ago

我用来训练印章识别,ctc_loss从一开始就是0

BurrowsWang commented 3 years ago

我用来训练印章识别,ctc_loss从一开始就是0

您用的印章数据集是哪个呢?

shuihsaiu commented 1 year ago

请问楼主,遇到的问题解决了么?

lzzzzj commented 1 year ago

没有,收敛不了,最后换模型了😥