chineseocr / trocr-chinese

transformers ocr for chinese
338 stars 53 forks source link

修改processor后重新训练 #39

Open jelly-Ding opened 1 year ago

jelly-Ding commented 1 year ago

你好,感谢您的工作

我注意到processor是resize到384x384,在长文本行识别效果不好,所以修改了embedding方式后,可能需要进行再一次预训练,所以想问下当初预训练时使用了哪些数据,有没有开源的数据可以使用

谢谢