音色还原，但是读音偶尔不标准，请问是什么原因

PlayVoice / whisper-vits-svc

Core Engine of Singing Voice Conversion & Singing Voice Clone

MIT License

2.56k stars 914 forks source link

Closed codexq123 closed 6 months ago

codexq123 commented 6 months ago

例如“鸡你太美（mei3）”，输出音频是“鸡你太美（mei2）”，请问是数据集的问题吗，还是其他原因，如何解决？

数据集：动漫数据26min，demucs去除杂音，再人肉听筛选走杂音太大的。

训练：利用预训练模型，finetune大概4万step

MaxMax2016 commented 6 months ago

codexq123 commented 6 months ago

可能是pitch提取的问题，您可以尝试RMVPE: https://github.com/thestmitsuki/so-vits-svc-rmvpe https://github.com/DLSeed/so-vits-svc-5.0

感谢及时回复，我尝试上面这个项目重新训练一下

codexq123 commented 6 months ago

可能是pitch提取的问题，您可以尝试RMVPE: https://github.com/thestmitsuki/so-vits-svc-rmvpe https://github.com/DLSeed/so-vits-svc-5.0

感谢及时回复，我尝试上面这个项目重新训练一下

无须重新训练，将RMVPE作为pitch预测，推理再无音调问题，问题解决