YCG09 / chinese_ocr

CTPN + DenseNet + CTC based end-to-end Chinese OCR implemented using tensorflow and keras
Apache License 2.0
2.75k stars 1.08k forks source link

ctpn/prepare_training_data/split_label.py 是否有问题? #259

Open maozezhong opened 5 years ago

maozezhong commented 5 years ago

你好,首先感谢分享代码! chinese_ocr/ctpn/prepare_training_data/split_label.py 第49-70行这种策略是否有问题? 比如对于一个平行四边形的label框,按照你的方法出来的xmin并不是xmin,并且你的方法分割出来的小框高度都是固定的,对于斜的平行四边形gt貌似不太友好? 是不是应该参照text-detection-ctpn/utils/prepare/utils.py 中的shrink_poly这个方法来呢? 请指教~

kennybai commented 5 years ago

请问下split_label.py中gt_file是如何生成的呢

1LOVESJohnny commented 4 years ago

同问如何生成的gt_file,另外,请问哪里可以找到原始的txt标注数据呢? 云盘下载的数据是xml格式,但是xml里框的数量和图像上的字符数量对应不上。想请问是如何生成的?