Closed kill2013110 closed 2 years ago
例如我已知该图片全为数字,那么我把rnn的输出的字母部分屏蔽为一个很小的值,这样应该能提高准确率。 但我试了一下这样好像会严重破坏后续的ctc解码(CTCGreedyDecoder)。 有什么办法可以实现白名单功能吗? 我记得谷歌的Tesseract-OCR在lstm识别模式下白名单功能就会被禁用
没尝试过,但你对非数字部分加上“掩码”后,可以再映射一下每个序列的概率,ctc解码部分应该对最后的概率矩阵有一些事先的假设,比如每个序列的概率和为1之类的。具体得看解码部分的实现。
例如我已知该图片全为数字,那么我把rnn的输出的字母部分屏蔽为一个很小的值,这样应该能提高准确率。 但我试了一下这样好像会严重破坏后续的ctc解码(CTCGreedyDecoder)。 有什么办法可以实现白名单功能吗? 我记得谷歌的Tesseract-OCR在lstm识别模式下白名单功能就会被禁用