训练维语OCR识别模型，acc一直都是1.0000 - Githubissues

PaddlePaddle / PaddleOCR

Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)

https://paddlepaddle.github.io/PaddleOCR/

Apache License 2.0

43.55k stars 7.77k forks source link

训练维语OCR识别模型，acc一直都是1.0000 #9901

Closed kongfnajie closed 8 months ago

kongfnajie commented 1 year ago

我用维语数据集训练了很多OCR识别模型，都是从零开始训练的，有的模型可以正常训练出成果，acc是稳步提升的，如SVTR、ABINet、RFL等。但有的模型不行，acc一开始就一直是1.0000，如RobustScanner、SEED等....loss是逐步下降的，就是acc显示不正确，训练集测试集上的acc一直都是1.0000，请问这是什么原因，是计算acc的模块出错了吗，是不是因为是维语才出现这样的问题，那为什么有的模型正常有的模型出错呢

kongfnajie commented 1 year ago

作者可以解答一下我的问题吗

kongfnajie commented 1 year ago

我的维语数据集也不小，大概有50w张图片，应该不是数据集的问题

kongfnajie commented 1 year ago

kongfnajie commented 1 year ago

训练了几十轮的模型，单独进行测试，测试结果也是1.0000。尝试了把数据转换成LMDB格式，也没有解决问题。

kongfnajie commented 1 year ago

是不是有的模型不兼容维语这种从右往左的顺序？类似阿拉伯语

andyjiang1116 commented 1 year ago

从右往左需要把标签反一下，这样能保留语义信息

kongfnajie commented 1 year ago

从右往左需要把标签反一下，这样能保留语义信息

就是读取标签的时候，将标签列表倒置一下吗？我知道这个可以在dataloader的encode里面实现，但好像并不是导致acc始终为1.00的原因，而且为什么有的模型没有任何修改却也可以正常用维语训练。

super-tian commented 1 year ago

我比较好奇的是，到底识别的对不对 @kongfnajie

kongfnajie commented 1 year ago

我比较好奇的是，到底识别的对不对 @kongfnajie

虽然acc一直是0，但是训练过程中loss是逐步下降的，我没测试过，但应该是训练出了一定的精度

github-actions[bot] commented 9 months ago

This issue has been automatically marked as stale because it has not had recent activity. It will be closed in 7 days if no further activity occurs. Thank you for your contributions.