htyjers / StrDiffusion

[CVPR 2024] Structure Matters: Tackling the Semantic Discrepancy in Diffusion Models for Image Inpainting
Apache License 2.0
85 stars 11 forks source link

train problem #33

Closed zf-666 closed 3 months ago

zf-666 commented 3 months ago

您好, 想请问下如果要修改训练集的图像大小该修改什么地方呢。例如将256256的输入改成480640 。 以及模型似乎可以直接推理480*640分辨率的输入图片,但速度慢很多,这是为啥?

感谢!

htyjers commented 3 months ago
  1. 以texture训练模型为例,您可以修改link1link2
  2. 因为分辨率变大了,u-net网络要处理的数据量更大,所以会变慢很多
zf-666 commented 3 months ago

感谢您的回复,希望可以提供一下多卡训练的代码。谢谢!

zf-666 commented 3 months ago

我的问题已解决, 由于pytorch的版本问题导致 --local-rank , --local_rank 写法不一致 python -m torch.distributed.launch --nproc_per_node=2 --master_port=6512 train.py -opt=options/train/ir-sde.yml --launcher pytorch