PaddlePaddle / PaddleOCR

Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)
https://paddlepaddle.github.io/PaddleOCR/
Apache License 2.0
43.55k stars 7.77k forks source link

训练维语OCR识别模型,acc一直都是1.0000 #9901

Closed kongfnajie closed 8 months ago

kongfnajie commented 1 year ago

我用维语数据集训练了很多OCR识别模型,都是从零开始训练的,有的模型可以正常训练出成果,acc是稳步提升的,如SVTR、ABINet、RFL等。但有的模型不行,acc一开始就一直是1.0000,如RobustScanner、SEED等....loss是逐步下降的,就是acc显示不正确,训练集测试集上的acc一直都是1.0000,请问这是什么原因,是计算acc的模块出错了吗,是不是因为是维语才出现这样的问题,那为什么有的模型正常有的模型出错呢

kongfnajie commented 1 year ago

作者可以解答一下我的问题吗

kongfnajie commented 1 year ago

我的维语数据集也不小,大概有50w张图片,应该不是数据集的问题

kongfnajie commented 1 year ago

train.log

kongfnajie commented 1 year ago

训练了几十轮的模型,单独进行测试,测试结果也是1.0000。尝试了把数据转换成LMDB格式,也没有解决问题。

kongfnajie commented 1 year ago

是不是有的模型不兼容维语这种从右往左的顺序? 类似阿拉伯语

andyjiang1116 commented 1 year ago

从右往左需要把标签反一下,这样能保留语义信息

kongfnajie commented 1 year ago

从右往左需要把标签反一下,这样能保留语义信息

就是读取标签的时候,将标签列表倒置一下吗?我知道这个可以在dataloader的encode里面实现,但好像并不是导致acc始终为1.00的原因,而且为什么有的模型没有任何修改却也可以正常用维语训练。

super-tian commented 1 year ago

我比较好奇的是,到底识别的对不对 @kongfnajie

kongfnajie commented 1 year ago

我比较好奇的是,到底识别的对不对 @kongfnajie

虽然acc一直是0,但是训练过程中loss是逐步下降的,我没测试过,但应该是训练出了一定的精度

github-actions[bot] commented 9 months ago

This issue has been automatically marked as stale because it has not had recent activity. It will be closed in 7 days if no further activity occurs. Thank you for your contributions.