Sanster / tf_ctpn

Tensorflow CTPN
MIT License
39 stars 16 forks source link

为什么要加入中文数据训练呢? #8

Open jiangmiaotong opened 5 years ago

jiangmiaotong commented 5 years ago

ICDAR13是纯英文数据集,所以想请问作者,为什么要加入中文的数据训练?

Sanster commented 5 years ago

因为数据比较少,就用 MLT 多语言的一起训练了,我也试过只用 MLT 中 latin 的来训练,在 ICDAR13 的测试集上效果变差了

jiangmiaotong commented 5 years ago

嗯嗯,了解了。 我这边抽取了MLT的latin加icdar13共3256张,也尝试训训效果,效果好的话再和你交流~