你好，首先很感谢你的工作，获益很多，请教一下您有试过添加白名单功能吗

FLming / CRNN.tf2

Convolutional Recurrent Neural Network(CRNN) for End-to-End Text Recognition - TensorFlow 2

MIT License

152 stars 56 forks source link

Closed kill2013110 closed 2 years ago

kill2013110 commented 2 years ago

例如我已知该图片全为数字，那么我把rnn的输出的字母部分屏蔽为一个很小的值，这样应该能提高准确率。但我试了一下这样好像会严重破坏后续的ctc解码（CTCGreedyDecoder）。有什么办法可以实现白名单功能吗？我记得谷歌的Tesseract-OCR在lstm识别模式下白名单功能就会被禁用

FLming commented 2 years ago

没尝试过，但你对非数字部分加上“掩码”后，可以再映射一下每个序列的概率，ctc解码部分应该对最后的概率矩阵有一些事先的假设，比如每个序列的概率和为1之类的。具体得看解码部分的实现。