Closed gobigrassland closed 1 month ago
本论文是否支持,将音频与嘴部关键点序列共同作为条件进行驱动生成视频? 考虑到音频内在的嘴部运动与提供嘴部关键点序列可能不匹配,导致合成视频的嘴部运动混乱。
如果同时输入,pose的驱动会占主导。
本论文是否支持,将音频与嘴部关键点序列共同作为条件进行驱动生成视频? 考虑到音频内在的嘴部运动与提供嘴部关键点序列可能不匹配,导致合成视频的嘴部运动混乱。