Closed codexq123 closed 6 months ago
可能是pitch提取的问题,您可以尝试RMVPE: https://github.com/thestmitsuki/so-vits-svc-rmvpe https://github.com/DLSeed/so-vits-svc-5.0
可能是pitch提取的问题,您可以尝试RMVPE: https://github.com/thestmitsuki/so-vits-svc-rmvpe https://github.com/DLSeed/so-vits-svc-5.0
感谢及时回复,我尝试上面这个项目重新训练一下
可能是pitch提取的问题,您可以尝试RMVPE: https://github.com/thestmitsuki/so-vits-svc-rmvpe https://github.com/DLSeed/so-vits-svc-5.0
感谢及时回复,我尝试上面这个项目重新训练一下
无须重新训练,将RMVPE作为pitch预测,推理再无音调问题,问题解决
例如“鸡你太美(mei3)”,输出音频是“鸡你太美(mei2)”,请问是数据集的问题吗,还是其他原因,如何解决?
数据集:动漫数据26min,demucs去除杂音,再人肉听筛选走杂音太大的。
训练:利用预训练模型,finetune大概4万step