用别人训练完的模型直接推理出音频，音频中只有啊，怎么处理？

innnky / so-vits-svc

基于vits与softvc的歌声音色转换模型

GNU Affero General Public License v3.0

3.61k stars 6 forks source link

Open yukino171 opened 1 year ago

yukino171 commented 1 year ago

就是，音频里ai只会发出“啊”的声音，音高是对的，但是完全没有在说人话，怎么办？（另外，感觉声音有点糊）

NaruseMioShirakana commented 1 year ago

你的hubert是否正确，不同的hubert模型从音频中提取出的向量有非常大的差别，是无法通用的，这个问题主要体现在4.0,4.0以下以及cn hubert上