GlassyWing / text-detection-ocr

Chinese text detection and recognition based on CTPN + DENSENET using Keras and Tensor Flow,使用keras和tensorflow基于CTPN+Densenet实现的中文文本检测和识别
Apache License 2.0
285 stars 116 forks source link

数据标签 #5

Closed ling20180713 closed 5 years ago

ling20180713 commented 5 years ago

请问densenet 识别的数据标签是怎么制作的

GlassyWing commented 5 years ago

图片是用中英文语料生成的,大小固定为(280, 32)。标签文件中每一行是,“图片名 \t 文本标签” 的格式,文本标签表示的是每一个字在字典中的顺序。这里的数据集是直接从https://github.com/YCG09/chinese_ocr获取的,至于如何生成图片,参考https://github.com/Sanster/text_renderer