FLming / CRNN.tf2

Convolutional Recurrent Neural Network(CRNN) for End-to-End Text Recognition - TensorFlow 2
MIT License
152 stars 56 forks source link

你好,首先很感谢你的工作,获益很多,请教一下您有试过添加白名单功能吗 #33

Closed kill2013110 closed 2 years ago

kill2013110 commented 2 years ago

例如我已知该图片全为数字,那么我把rnn的输出的字母部分屏蔽为一个很小的值,这样应该能提高准确率。 但我试了一下这样好像会严重破坏后续的ctc解码(CTCGreedyDecoder)。 有什么办法可以实现白名单功能吗? 我记得谷歌的Tesseract-OCR在lstm识别模式下白名单功能就会被禁用

FLming commented 2 years ago

没尝试过,但你对非数字部分加上“掩码”后,可以再映射一下每个序列的概率,ctc解码部分应该对最后的概率矩阵有一些事先的假设,比如每个序列的概率和为1之类的。具体得看解码部分的实现。