j-river / svtr-pytorch

pytorch version of svtr model
19 stars 3 forks source link

咨询下我用pytorch训练模型,训练时图片固定输入320*32大小,推理时也只能固定为320*32吗?,我看paddleocr里可以固定高为32或者48,宽度不固定 #3

Open apple2333cream opened 1 year ago

j-river commented 1 year ago

推理时,如果是单张推理,宽度不用做限制,高度resize到32就行;如果是batch推理,可以选择batch中宽度最大的尺寸进行resize。高度48这个我没试过,如果设置成48,对应的模型参数或者层数可能会有变化,高度方向的维度经过下采样最终要变成1。

apple2333cream commented 1 year ago

,训练模型时我预处理成32320大小,推理时如果宽度不固定 (假设缩放至32224),推理时会报错: assert H == 32 and W ==320, \ f"Input image size ({32}{224}) doesn't match model ({32{320).", 请问下我是哪里没有设置好啊?

j-river commented 1 year ago

不好意思,说错了,这里的svtr版本宽度也是固定的,后续推理的图片尺寸要处理成和模型初始化时指定的尺寸一致。paddle里好像提到后续会有尺寸不固定的版本,但是没有关注。

j-river commented 1 year ago

你这里送入的图片是32224, 模型初始化的图片尺寸是32320, 你需要在预处理的时候把32224的图片处理成32320再送入模型

apple2333cream commented 1 year ago

明白了 ,多谢大佬解惑!