chineseocr / trocr-chinese

transformers ocr for chinese
338 stars 53 forks source link

手写识别训练数据增强问题 #7

Open ziyaxuanyi opened 2 years ago

ziyaxuanyi commented 2 years ago

请问,手写模型训练所使用的数据是否有添加背景再训练,注意到数据集中的图片都是完全的纯白色背景,这样训练出来的模型,对有背景的图片会完全识别不了,但是测试模型是能够识别有背景色的图片的,这是为什么呢?

zlmaker commented 1 year ago

希望作者能够加一个去背景的东西,这样更具有通用性,识别更准确