yinchangchang / ocr_densenet

第一届西安交通大学人工智能实践大赛(2018AI实践大赛--图片文字识别)第一名;仅采用densenet识别图中文字
459 stars 159 forks source link

请问这个是单纯的DenseNet 还是DenseNet+CTC #3

Open xikunlun001 opened 6 years ago

xikunlun001 commented 6 years ago

我看您这个的效果很好 不知道这个结果为什么超过和DenseNet +CTC 最后不能识别重复字符是denseNet的原因吗

感谢~

yinchangchang commented 6 years ago

这是一个单纯的multi-label分类的densenet,没有用CTC。 可以在一定程度上识别重复字符,对整张图片进行了一次从左到右的扫描,能识别不连续的重复字符。 对于连续的重复字符,在相邻的两个扫描中,都会有预测有相同的一个字,这时模型不知道是一个字太大占据了两次扫描的空间,还是两个相同的字。

xikunlun001 commented 6 years ago

@yinchangchang 理解了 感谢~

kasyoukin commented 5 years ago

这不就是CTC的 merge repeated ?