Doubiiu / DynamiCrafter

[ECCV 2024] DynamiCrafter: Animating Open-domain Images with Video Diffusion Priors
Apache License 2.0
2.09k stars 165 forks source link

输入图片需要和生成的视频同样分辨率吗? #46

Open aguang1201 opened 3 months ago

aguang1201 commented 3 months ago

很棒的工作,感谢分享。注意到现在可以生成三种分辨率的视频:576x1024,320x512,256x256。请问输入的参考图片要使用和输入视频同样分辨率的图片效果会更好吗?还是代码中有前处理会自动把图像resize到视频分辨率上?谢谢

Doubiiu commented 3 months ago

应该是越接近对应的分辨率效果会越好,当然代码中也会有简单的短边resize+中心crop的方式做预处理。模型方面个人还是推荐1024x576的模型,分辨率大了效果看起来更好

aguang1201 commented 3 months ago

谢谢,看到代码了,前处理做了resize的话,那只要关心图片的比例就好了。 transform = transforms.Compose([ transforms.Resize(min(video_size)), transforms.CenterCrop(video_size), transforms.ToTensor(), transforms.Normalize(mean=(0.5, 0.5, 0.5), std=(0.5, 0.5, 0.5))])