chineseocr / trocr-chinese

transformers ocr for chinese
338 stars 53 forks source link

请问印章识别的数据和权重文件脱敏后还会开源吗? #27

Open 1191658517 opened 1 year ago

1191658517 commented 1 year ago

感谢作者的贡献, 请问印章识别的数据和权重文件脱敏后还会开源下吗? 如果会的话什么时候才计划什么时候呢

UnstoppableCurry commented 1 year ago

做端到端识别 只能识别固定类型和方向的印章吧,我这边做了很多实验,模型拟合的很快,但是不能指望复杂任务 用当前的loss 就能搞定 缺失方向信息 以及印章的结构化数据的loss 很难做到商用的泛化性能。简单任务确实不错 复现了91%的准确率

papersuper commented 1 year ago

请问可以提供一下 印章的预训练模型吗,或者训练的数据集格式,非常感谢!

ChenCong7375 commented 9 months ago

做端到端识别 只能识别固定类型和方向的印章吧,我这边做了很多实验,模型拟合的很快,但是不能指望复杂任务 用当前的loss 就能搞定 缺失方向信息 以及印章的结构化数据的loss 很难做到商用的泛化性能。简单任务确实不错 复现了91%的准确率

作者的预训练模型可以分享一下吗?谢谢!

cqray1990 commented 5 months ago

做端到端识别 只能识别固定类型和方向的印章吧,我这边做了很多实验,模型拟合的很快,但是不能指望复杂任务 用当前的loss 就能搞定 缺失方向信息 以及印章的结构化数据的loss 很难做到商用的泛化性能。简单任务确实不错 复现了91%的准确率

我训练的时候也是这样,请问有更好的方式推荐?可以交流一下?

STEARGAZER commented 4 months ago

印章训练使用的训练集使用什么软件进行的标注,有什么特殊要求吗?