senlinuc / caffe_ocr

主流ocr算法研究实验性的项目,目前实现了CNN+BLSTM+CTC架构
1.26k stars 536 forks source link

是否ctc对连续数字的识别率不够高? #67

Closed ares89 closed 6 years ago

ares89 commented 6 years ago

我尝试使用模型识别包含 000.000 666,66 0.8888 5000,000,00等数字的图片 最终都没有能正确识别 总是丢失字符 请问有没有遇到同样问题的?

piaobuliao commented 6 years ago

对于连续的相同数字CTC是容易漏,考虑多增加些这种样本

ares89 commented 6 years ago

找到原因了,要对图片进行拉伸