Closed ZerRui closed 4 years ago
1.建议检查下预测的landmark是否抖动,一般情况下landmark不抖动生成的图像也不会抖动。可以考虑对您自己采集的音频数据进行预处理,比如去噪、滤波平滑等操作。 2.对于音频预测的landmark存在抖动,可以考虑在生成图像时添加时序平滑loss。
感谢您的回复! 您再实验过程中,有没有尝试过直接网络生成带背景的整图,不进行裁剪?
@zhangzjn 2.对于音频预测的landmark存在抖动,可以考虑在生成图像时添加时序平滑loss。
请问这里是指在第一阶段的网络里加时序平滑吗?还是第二阶段加?
张老师您好,有几个问题还想请教您: 1.我看您最后生成视频的时候是放慢了5倍,这个是出于帧率的考虑还是什么原因呢? 2.您上面说的时序平滑loss,是加在第二阶段还是第一阶段的网络呢? 3.您有没有尝试过直接合成整张图片或者只合成嘴部图片,这种您觉着可行吗? 期待您的回复!
1.5帧是为了观感。 2.两阶段都可以尝试 3.可行,全图对算力要求高一些
您好,关于时序平滑loss, 有什么参考资料吗
首先很感谢您的分享! 按照您的代码,我们生成的图片序列抖动的比较厉害,您有什么建议应该怎么去除抖动吗?谢谢!