TMElyralab / MuseV

MuseV: Infinite-length and High Fidelity Virtual Human Video Generation with Visual Conditioned Parallel Denoising
Other
2.09k stars 212 forks source link

低端显卡的处理时长问题 #109

Open iraymondking opened 1 month ago

iraymondking commented 1 month ago

tesla m40 24G,text2video,生成3秒需要1个多小时,但是将产生的这个视频用MuseTalk处理很快。MuseV是没优化好,还是过期显卡就这个效果?还是设置问题?

xzqjack commented 1 month ago

tesla m40 24G,text2video,生成3秒需要1个多小时,但是将产生的这个视频用MuseTalk处理很快。MuseV是没优化好,还是过期显卡就这个效果?还是设置问题?

musev 是生成整个视频,musetalk是只生成嘴部的部分,所需要生成的分辨率是大大不同的,而这又极大影响了生成耗时。 MuseV 推断层面的确是存在较多优化空间的。