AlonzoLeeeooo / ControlNeXt-svd-shape

A re-implementation of ControlNeXt trained with shape guidance.
MIT License
3 stars 0 forks source link

关于controlNeXt-svd的复现 #1

Closed potentialming closed 2 hours ago

potentialming commented 3 hours ago

请问你复现的是controlNeXt-svd v2吗?你除了改变了控制条件,是否对模型的结构,或者训练过程进行修改?因为我在复现controlNeXt-svd v2训练的过程中,出现推理所得到的图片动作不变的情况。请问你遇到过这种情况吗?或者你的代码是否已经解决了此问题?非常需要你的帮助,提前感谢!

AlonzoLeeeooo commented 3 hours ago

您好,我复现的代码来自ControlNeXt-SVD-v2的官方仓库。关于其他部分没有修改,直接是遵循官方代码中的实现,仅仅做了代码的清理、变量名修改这种简单的工作。

你说的这个情况其实我也有碰到过,事实上这个应该是SVD的问题,而并非ControlNeXt-SVD-v2的问题。个人感觉Stability AI他们做的这一版SVD模型性能还比较粗糙,可以尝试用一下阿里他们的I2VGen-XL(已有diffusers实现,链接为官方实现),效果会更好。

potentialming commented 2 hours ago

您好,我复现的代码来自ControlNeXt-SVD-v2的官方仓库。关于其他部分没有,直接是遵循修改修改官方代码中的实现,简单做了代码的清理、变量名这样简单的工作。

你说的这个情况其实我也有过一遍,其实这个应该是SVD的问题,而不是ControlNeXt-SVD-v2的问题。个人感觉Stability AI他们做的这个版本SVD模型性能还比较粗糙,可以尝试一下用一下阿里他们的I2VGen-XL(已有diffusers实现,链接为官方实现),效果会更好。

感谢您的耐心解答,那么您之后是如何解决这个问题的?或者,我使用您这个代码是否还会出现类似问题?也非常感谢您的推荐,我之后会去研究一下i2VGen。再次感谢

AlonzoLeeeooo commented 2 hours ago

后续由于一些其他原因,这个问题就暂时搁置了,我当时碰见这个问题使用的就是目前这个仓库的代码。我的个人建议是用更好的image-to-video generation models去替代SVD,可能会是一个可能的解决方案,供参考。

potentialming commented 2 hours ago

好的,知道了,感谢解答