数据预处理 - Githubissues

WenmuZhou / PSENet.pytorch

A pytorch re-implementation of PSENet: Shape Robust Text Detection with Progressive Scale Expansion Network

GNU General Public License v3.0

462 stars 138 forks source link

Closed xxlxx1 closed 4 years ago

xxlxx1 commented 4 years ago

现在这个数据预处理是参考east的，所以剪裁的时候是选择部分纯背景部分含文字且不会从中间切开，作者是都处理成label图像，然后和原图一起随机剪裁变化，如果训练数据含密集文本，用这个方法比较好

WenmuZhou commented 4 years ago

理论上east的好一点，但是测下来好像区别不大

xxlxx1 commented 4 years ago

之前我用增值税发票训练，因为到处都是框又不能从中间切断，所以随机剪裁出来的没什么区别，几乎都是原始图片，达不到数据增强的效果，像场景图片不存在这个问题