innnky / so-vits-svc

基于vits与softvc的歌声音色转换模型
GNU Affero General Public License v3.0
3.57k stars 1 forks source link

用别人训练完的模型直接推理出音频,音频中只有啊,怎么处理? #166

Open yukino171 opened 1 year ago

yukino171 commented 1 year ago

就是,音频里ai只会发出“啊”的声音,音高是对的,但是完全没有在说人话,怎么办?(另外,感觉声音有点糊)

NaruseMioShirakana commented 1 year ago

你的hubert是否正确,不同的hubert模型从音频中提取出的向量有非常大的差别,是无法通用的,这个问题主要体现在4.0,4.0以下以及cn hubert上