senlinuc / caffe_ocr

主流ocr算法研究实验性的项目,目前实现了CNN+BLSTM+CTC架构
1.26k stars 535 forks source link

关于no-blstm的一些疑惑 #25

Open zyxrrr opened 6 years ago

zyxrrr commented 6 years ago

你好!我看了cnn+blstm+ctc的网络结构,cnn最后输出的是一系列的向量,经过blstm转换成每个向量的预测分布,最后由ctc得到结果。 README中提到“no-blstm”表示没有lstm层,CNN直接对接CTC。这样是如何将向量序列得到预测分布呢? 或者请给我一篇相关论文,不胜感激!

senlinuc commented 6 years ago

cnn跟blstm输出的特征向量并没有本质区别,都是图像切片的表征,不同的是blstm会在cnn特征的基础上做了更大感受野的融合。 理论上blstm融合后的特征会更好,特别是对于复杂的情况,比如VGG英文数据集上no-blstm的效果要差很多。 这方面貌似没有发现有类似尝试的论文,no-lstm算是一个灵机一动的尝试,工程方面的意义更大些吧。

zyxrrr commented 6 years ago

谢谢回答!