Hangz-nju-cuhk / Talking-Face_PC-AVS

Code for Pose-Controllable Talking Face Generation by Implicitly Modularized Audio-Visual Representation (CVPR 2021)
Creative Commons Attribution 4.0 International
916 stars 169 forks source link

中文的支持 #34

Closed nopeiyu closed 2 years ago

nopeiyu commented 3 years ago

您好,看了你给出的示例视频,对中文也有较好的支持,请问你使用中文进行训练了?还有就是请教一下为什么没有采用mfcc或fbank等音频特征,作者有没有尝试其他音频特征吗,现在的音频特征获得了最好的效果吗

Hangz-nju-cuhk commented 3 years ago

我没有用中文训练过模型,也没有试过其他的音频特征,可以算是ablation study缺失吧。但是根据我的经验mfcc应该效果也不会差。