WenmuZhou / PSENet.pytorch

A pytorch re-implementation of PSENet: Shape Robust Text Detection with Progressive Scale Expansion Network
GNU General Public License v3.0
462 stars 138 forks source link

数据预处理 #51

Closed xxlxx1 closed 4 years ago

xxlxx1 commented 4 years ago

现在这个数据预处理是参考east的,所以剪裁的时候是选择部分纯背景部分含文字且不会从中间切开,作者是都处理成label图像,然后和原图一起随机剪裁变化,如果训练数据含密集文本,用这个方法比较好

WenmuZhou commented 4 years ago

理论上east的好一点,但是测下来好像区别不大

xxlxx1 commented 4 years ago

之前我用增值税发票训练,因为到处都是框又不能从中间切断,所以随机剪裁出来的没什么区别,几乎都是原始图片,达不到数据增强的效果,像场景图片不存在这个问题