AstarLight / Lets_OCR

A repository for OCR, which inlcudes some classical OCR algorithms Pytorch implementation such as CTPN, EAST and CRNN.
MIT License
656 stars 327 forks source link

关于crnn训练的自定义数据集准备 #86

Open wting861006 opened 4 years ago

wting861006 commented 4 years ago

我看了作者提供的数据集内容,貌似中文字段并不是随机拼凑,而是有一定语义的文本。我有点疑惑,我在使用图片生成工具的时候是随机拼凑, 还是必须找一些语料库,在其中随机截取定长的字段?