mxin262 / SwinTextSpotter

Pytorch re-implementation of Paper: SwinTextSpotter: Scene Text Spotting via Better Synergy between Text Detection and Text Recognition (CVPR 2022)
275 stars 42 forks source link

预训练的模型生成mask结果正常,微调(fine-tuning)之后结果就变得很差 #89

Open Cen-Lu opened 1 year ago

Cen-Lu commented 1 year ago

作者您好,

我想使用自己的数据集微调模型,并复现代码。

MicrosoftTeams-image

预训练的模型生成结果都很正常,但是微调之后的mask就变得很奇怪,感觉坐标完全不对。我不知是不是数据处理过程出了问题。您可以帮我分析一下可能的原因吗?

此外,我刚入门深度学习,学的还不是很明白,为什么这里坐标1,2被跳过了,而使用的是3和7,能请您给我解答一下吗?

MicrosoftTeams-image (1)

十分感谢!

mxin262 commented 1 year ago

是按照readme微调吗?这些可以根据数据的特点做一些修改