Sanster / tf_ctpn

Tensorflow CTPN
MIT License
39 stars 16 forks source link

关于标注训练数据集的问题 #6

Open xdwjc opened 5 years ago

xdwjc commented 5 years ago

您好博主,我想请教一下您这个标注训练集是跟目标检测一样用LabelImg这种类似的工具先标成的大的矩形框,在用那个icdar13_split_label.py这个文件把大框分割成一个个小框,在用icdar13_to_voc.py转化为VOC数据格式的吗,这样的话,这个icdar13_split_label.py这个文件的输入标签文件是txt格式还是xml格式的,能请问一下您标注大框用的是哪个标注软件标注的吗,次外,这个我能否标注稍微倾斜一点点的文本框?因为我看ctpn也可以检测稍微倾斜一点的文本,这样的话有些倾斜的训练集的框岂不是也要标成倾斜的,这里一直搞不明白,还望请您赐教

Sanster commented 5 years ago
  1. icdar13_split_label.py 输入的具体格式,看一下读取的地方就知道了
  2. 大框的标注是 icdar MLT 2017 自带的,有旋转的矩形
xdwjc commented 5 years ago

好的,谢谢博主大大

xdwjc commented 5 years ago

博主,我下了 icdar MLT 2017数据集,发现有些文本框是竖直和横向倾斜的的,在训练的时候这些带有竖直文本框和横向倾斜文本框的图片要不要给他剔除掉呢,另外您自己有没有标注过自己的数据集,对于倾斜的文本框标注您有什么经验,我想自己标注一下身份证文本框重新训练一下,因为用ctpn作者提供的训练好的模型去检测身份证有些框会漏检 您要是方便的话我想加您qq或微信交流学习一下,不方便的话就在github上请教您 在您的github也问了您很多问题了 我qq:1164757353 vx:wjc953368