请问界面中可以选择的那个参考音频是什么作用

jerryuhoo / VTuberTalk

Apache License 2.0

366 stars 54 forks source link

Closed kslz closed 2 years ago

kslz commented 2 years ago

试了一下好像没听出变化来

jerryuhoo commented 2 years ago

GST训练的时候用，GST的作用是让输出的音频的语气语调更加像参考音频一点，但是实际上效果也一般，默认设置为False，就没有作用。前几天更新了一下，目前选择普通fastspeech模型的时候会隐藏掉这个参考音频的按钮。

kslz commented 2 years ago

感谢解答