Closed czy36mengfei closed 2 years ago
这个项目的口型同步确实是一个短板,不光口型与声音不太同步,而且仔细观察可以发现口型跟音节特点不一致,基本就是在乱动。样例视频只是粗看之下还可以。
如果对于任何数据都是一样的口型,那么应该是实现错误。參考 #37
使用中文数据fine-tuning结果很差,我目前认为有几点可能原因: 1)DeepSpeech feature对中文不太适用,可以直接使用MFCC feature 2)Deep3DfaceReconstruction嘴部结果不够精确,可以考虑使用DECA替代 https://github.com/YadiraF/DECA 3)我们网络单次输出128帧,可能需要增加训练数据。如果有改进结果也可以提出pull request,我有空会尝试测试其他网络结构。
您好, 我在用您提供的的模型和流程训练新的形象,用的中文视频微调,发现嘴型同步效果很差,甚至不同语音的嘴部动作都差不多。 请问audio2face预训模型的问题还是其他什么问题。 谢谢。