Gmgge / TrOCR-Seal-Recognition

基于transformer的ocr识别,在公章(印章识别, seal recognition)拓展应用
121 stars 24 forks source link

印章预训练模型 #13

Closed whiteless9 closed 8 months ago

whiteless9 commented 8 months ago

请问有公开印章预训练模型的计划吗?我基于TAL_OCR_CHN微调效果很一般

Gmgge commented 8 months ago

384的模型已经公布,在readme的链接中,320的模型尚未通过审核,可以尝试我的部署项目中的在线demo。

我近期将推出真实数据与生成数据,让大家都可以训练出基本有效的模型。

whiteless9 commented 8 months ago

readme中的是导出的onnx推理模型吧?我目前是基于handwrite上训练印章识别,效果很一般,跟你的模型推理结果相比差很多,所以想请教一下相关预训练模型的问题

Gmgge commented 8 months ago

1.数据方面 真实印章的数据量需要一定量,具体数目没有测试过,暂定3000+以上,同时加上生成的10w+印章(记得给一定的数据增强,随机纹理,旋转,文字背景,记得生成常用字符的印章,真实数据集不够大时,字典太小了) 2.预训练模型 我这边使用表格识别的预训练模型,而不是handwrite 3.训练参数 无变换

whiteless9 commented 8 months ago

明白了 多谢