zhengchen1999 / CAT

PyTorch code for our NeurIPS 2022 paper "Cross Aggregation Transformer for Image Restoration"
Apache License 2.0
116 stars 8 forks source link

关于图像输入大小问题 #4

Closed Chowhound-wmz closed 1 year ago

Chowhound-wmz commented 1 year ago

请问如果用256x256的图像输入,Cat模型的参数有没有调整的规范

zhengchen1999 commented 1 year ago

你好, CAT可以接受任意大小的输入图像,不用对模型参数进行调整。 另外为了便于训练,也可以将YML文件(例如:train_CAT_A_sr_x2.yml)中的img_size: 64修改为img_size: 256

Chowhound-wmz commented 1 year ago

好的谢谢,在输入图像为256时,用Cat_unet模型进行训练需要多大显存的GPU呢,我用32G的单GPU训练似乎跑不起来

zhengchen1999 commented 1 year ago

你好,由于CAT_Unet,在DN上的训练是按照Restormer进行设置的,所以显存需要求较多,输入图像为256,batch size/per GPU 为2时,需要69G显存。 这里可以考虑减小训练图像大小,或者batch size。此外也可以考虑降低模型本身的大小,或者将Cat_unet中的CATB_axial (axial-Rwin)替换为CATB_regular (regualr-Rwin)。

Chowhound-wmz commented 1 year ago

谢谢!