wenwenyu / MASTER-pytorch

Code for the paper "MASTER: Multi-Aspect Non-local Network for Scene Text Recognition" (Pattern Recognition 2021)
https://arxiv.org/abs/1910.02562
MIT License
277 stars 53 forks source link

长文本识别效果如何改进? #22

Open 2017ZYS opened 2 years ago

2017ZYS commented 2 years ago

默认训练图片是3*48*160进入网络,我尝试使用1*32*320训练中文数据集,STRING_MAX_LEN设置为150(足够满足大部分文本行长度)但是我在测试的时候发现,如果强制resize到32*320,有些长文本效果并不是很好,想请教一下有哪些改进方法?

VixeruntR commented 2 years ago

请问这个问题有进展吗?我训练尺寸是48*240,短文本识别效果蛮好,但是长文本就几乎全错了。 有时候还会出现这类现象:比如图像上内容是“年龄:15”,但是预测结果却是“年龄:1555555555555555555555555555555555555555555555555......”好多个。