Gmgge / TrOCR-Seal-Recognition

基于transformer的ocr识别,在公章(印章识别, seal recognition)拓展应用
121 stars 24 forks source link

如何共享数据集? #3

Closed LUXUS1 closed 11 months ago

LUXUS1 commented 11 months ago

我现在有1.5k左右的数据,都是自己合成的,请问如何共享?数据如下图所示: image

Gmgge commented 11 months ago

很感谢你的想法,关于合成公章我这边生成很多,目前缺少的是真实公章。

还是很感谢你的分享,不知道你这边是否收集了这个ICDAR 2023 Competition on Reading the Seal Title比赛的数据集。

至于生成公章,不知道你是否尝试过这个网站

LUXUS1 commented 11 months ago

很感谢你的想法,关于合成公章我这边生成很多,目前缺少的是真实公章。

还是很感谢你的分享,不知道你这边是否收集了这个ICDAR 2023 Competition on Reading the Seal Title比赛的数据集。

至于生成公章,不知道你是否尝试过这个网站

非常感谢大佬,目前生成公章使用的就是这个网站,ICDAR的数据集也有使用。但我在训练的过程中发现TrOCR很容易过拟合,不知道您这边的是怎么解决的?此外,还想问一下您的训练数据量大约有多少?