kerlomz / captcha_trainer

[验证码识别-训练] This project is based on CNN/ResNet/DenseNet+GRU/LSTM+CTC/CrossEntropy to realize verification code identification. This project is only for training the model.
Apache License 2.0
3.02k stars 821 forks source link

关于输入图片shape的问题 #59

Closed kinda830 closed 4 years ago

kinda830 commented 4 years ago
  1. 模型的图片输入shape不应该是[batch_size, image_width, image_height, image_channel]吗?但是 core.py 里面的采用ctc loss function 时,模型输入shape却是[None, image_height, image_channel]?是我配置错了吗?
  2. 数据从 tfrecords 里面读取出来是一个长串的字节码吧,读取时也没有做任何处理就直接输入模型,不用reshape图片原来大小?或者转换成图片向量?
  3. 现在无法执行训练了,一直报错:(0) Invalid argument: Not enough time for target transition sequence (required: 6, available: 5)11You can turn this error into a warning by using the flag ignore_longer_outputs_than_inputs
kinda830 commented 4 years ago

没人回答,自我回答一下:

  1. 模型输入采用的keras input API,不需要指定batch_size;这个没有配置错误
  2. 关于制作tfrecord的代码采用图片的字节码,是因为图片处理的代码放在了encoder里面,获取batch图片时对图片进行处理;
  3. 出现这个错误呢是因为图片太小了,我输入的图片大小为7026的。现在图片大小更改为20060之后,没有报错了