Open lixiaoming0017 opened 4 years ago
您好,看了您的代码收益匪浅,里面有3个问题请您解惑: 1.关于crnn训练数据的生成,我使用的是TextRecognitionDataGenerator,旋转,噪声,模糊,膨胀都可以,您说的随机添加字符间距是直接加入空格吗?还是有别的方法?能否给予代码参考一下。不胜感激 2.识别用的数据集是不定长的吗? 3.您在识别以后后面接的那个语言模型是怎么训练的,就是veterbi那个。
1.代码参考https://github.com/Sanster/text_renderer 2.是 3.viterbi计算的并不是语言模型,pkl存放的是两个字连接的概率,具体请查阅viterbi算法原理
您好,看了您的代码收益匪浅,里面有3个问题请您解惑: 1.关于crnn训练数据的生成,我使用的是TextRecognitionDataGenerator,旋转,噪声,模糊,膨胀都可以,您说的随机添加字符间距是直接加入空格吗?还是有别的方法?能否给予代码参考一下。不胜感激 2.识别用的数据集是不定长的吗? 3.您在识别以后后面接的那个语言模型是怎么训练的,就是veterbi那个。
1.代码参考https://github.com/Sanster/text_renderer 2.是 3.viterbi计算的并不是语言模型,pkl存放的是两个字连接的概率,具体请查阅viterbi算法原理
您好,针对上面的问题2和3,补充一下: 1,您如果是使用了不定长训练的,那么意味着,输入的 batch图片需要padding到固定长度,那 padding以后的部分需要计算损失吗?padding的时候用的黑色还是白色呢?
您好,看了您的代码收益匪浅,里面有3个问题请您解惑: 1.关于crnn训练数据的生成,我使用的是TextRecognitionDataGenerator,旋转,噪声,模糊,膨胀都可以,您说的随机添加字符间距是直接加入空格吗?还是有别的方法?能否给予代码参考一下。不胜感激 2.识别用的数据集是不定长的吗? 3.您在识别以后后面接的那个语言模型是怎么训练的,就是veterbi那个。