Closed peach-xiao closed 2 years ago
@xiaoguoguo2018 感谢提供反馈!
@xiaoguoguo2018 模型文件是由原论文SwinTransformer或ViT提供的预训练模型.pth转换.pdparams的 关于”尝试着将swinTransformer的原作者提供的预训练pth模型swin_tiny_patch4_windown7_224.pth(因为paddleViT没有提供upernet_swin系列的模型)转换为.pdparams却只能应用于224的大小“ 问题,我想可能原因是你设置您的输入分辨率不是window_size的整数倍时,需要进行padding处理。
1.代码中的预训练模型vit_large_patch16_224.pdparams是在ImagenNet1K还是ImagenNet22K上训练的吗?这个模型文件是由原论文SwinTransformer或ViT提供的预训练模型.pth转换.pdparams,还是开发者团队你们在ImageNet上训练训练后提供的?为什么将该模型应用于512x512大小的图片不会报错,而我尝试着将swinTransformer的原作者提供的预训练pth模型swin_tiny_patch4_windown7_224.pth(因为paddleViT没有提供upernet_swin系列的模型)转换为.pdparams却只能应用于224的大小。我没能明白开发团队提供的vit_large_patch16_224.pdparams却可以用于512x512,768x768等大小, 能否简单介绍一下该预训练模型
非常感谢!