中文定长训练，不定长识别？

bgshih / aster

Recognizing cropped text in natural images.

MIT License

726 stars 195 forks source link

中文定长训练，不定长识别？ #40

Closed Hubert2102 closed 5 years ago

Hubert2102 commented 5 years ago

你好，我用虚拟生成的10个字的数据进行训练，https://pan.baidu.com/s/1dFda6R3#list/path=%2F ，训练之后，在预测的时候结果也总是10个字左右，少于10个字的图片，预测就有重复字，多于10个字的图片，预测就会丢字，总之最后的结果都会是10±2个字，请问这是什么情况啊，不是应该支持不定长的识别么

ChChwang commented 5 years ago

所有的都是10个字符吗，训练集里如果有少于10个的呢

Hubert2102 commented 5 years ago

所有的都是10个字符吗，训练集里如果有少于10个的呢

不知道，我的训练集全都是10个字，没有少于10个字的，不过CRNN就是这么训练的，是支持不定长识别的，这个还没搞清楚 @ChChwang

li675599061 commented 5 years ago

@Hubert2102 兄台能否分享一下训练中文字符的详细步骤

Serenade-J commented 5 years ago

@li675599061 我也在训练中文字符，要不要加微信聊一下。。13126710122，现在模型还没训通想跟你交流一下

Serenade-J commented 5 years ago

@li675599061 我们对一下改动的地方

pageedward commented 5 years ago

@li675599061 @Serenade-J 请问中文训练你跑通了吗，训练数据里面的keypoints是必须的嘛，之前用crnn-pytorch版label大概是这样的，

ghost commented 5 years ago

你好，我用虚拟生成的10个字的数据进行训练，https://pan.baidu.com/s/1dFda6R3#list/path=%2F ，训练之后，在预测的时候结果也总是10个字左右，少于10个字的图片，预测就有重复字，多于10个字的图片，预测就会丢字，总之最后的结果都会是10±2个字，请问这是什么情况啊，不是应该支持不定长的识别么

您好，这个问题解决了吗。我按照Issues#36的中文训练进行了修改，最终在测试的时候也是碰到了这种识别输出都是10个字符定长的问题（无论输入大于还是小于10个字符）。请问您找到是什么原因了吗

Hubert2102 commented 5 years ago

你好，我用虚拟生成的10个字的数据进行训练，https://pan.baidu.com/s/1dFda6R3#list/path=%2F ，训练之后，在预测的时候结果也总是10个字左右，少于10个字的图片，预测就有重复字，多于10个字的图片，预测就会丢字，总之最后的结果都会是10±2个字，请问这是什么情况啊，不是应该支持不定长的识别么

您好，这个问题解决了吗。我按照Issues#36的中文训练进行了修改，最终在测试的时候也是碰到了这种识别输出都是10个字符定长的问题（无论输入大于还是小于10个字符）。请问您找到是什么原因了吗

你好，我的经验是用不定长数据对ASTER进行训练，不过在我的数据中，ASTER的中文识别能力目前不如CRNN