关于图像输入大小问题

zhengchen1999 / CAT

PyTorch code for our NeurIPS 2022 paper "Cross Aggregation Transformer for Image Restoration"

Apache License 2.0

116 stars 8 forks source link

关于图像输入大小问题 #4

Closed Chowhound-wmz closed 1 year ago

Chowhound-wmz commented 1 year ago

请问如果用256x256的图像输入，Cat模型的参数有没有调整的规范

zhengchen1999 commented 1 year ago

你好， CAT可以接受任意大小的输入图像，不用对模型参数进行调整。另外为了便于训练，也可以将YML文件（例如：train_CAT_A_sr_x2.yml）中的img_size: 64修改为img_size: 256。

Chowhound-wmz commented 1 year ago

好的谢谢，在输入图像为256时，用Cat_unet模型进行训练需要多大显存的GPU呢，我用32G的单GPU训练似乎跑不起来

zhengchen1999 commented 1 year ago

你好，由于CAT_Unet，在DN上的训练是按照Restormer进行设置的，所以显存需要求较多，输入图像为256，batch size/per GPU 为2时，需要69G显存。这里可以考虑减小训练图像大小，或者batch size。此外也可以考虑降低模型本身的大小，或者将Cat_unet中的CATB_axial (axial-Rwin)替换为CATB_regular (regualr-Rwin)。

Chowhound-wmz commented 1 year ago

谢谢！