mxin262 / SwinTextSpotter

Pytorch re-implementation of Paper: SwinTextSpotter: Scene Text Spotting via Better Synergy between Text Detection and Text Recognition (CVPR 2022)
275 stars 42 forks source link

关于训练的问题 #114

Open Kelsey-Zhao opened 11 months ago

Kelsey-Zhao commented 11 months ago

作者您好,想请教一下:

  1. 训练过程是基于设定max_iter和iter来进行训练的吗?(即每轮训练batchsize*iter张图片,然后训练max_iter/iter轮之后就停止训练)如果是这样的话是否只能保证训练集中的每张图片最多只被训练一次?是否会有训练不充分的问题?
  2. 根据cfg中的REC_HEAD中的BATCH_SIZE=8,意思是每轮训练中只有前8张文本图像会被训练到?那么如果一张图像中有超过8个文本,那么是不是剩下的文本就训练不到了?

麻烦作者指点迷津,谢谢!

mxin262 commented 10 months ago
  1. 是的。训练的迭代次数足够的话,不会有训练不充分的问题。
  2. REC_HEAD中的BATCH_SIZE指的是识别部分的batchsize,你的理解是对的。
Huangqqqhhh commented 7 months ago

你好,请问iter是指WARMUP_ITERS嘛