Closed luoliyushu closed 6 months ago
向您请教一下,GPT-SOVITS preset里面该怎么填才能读取到wav路径和参考文本内容 不会代码所以没看懂/(ㄒoㄒ)
您可以使用它来教一下,GPT-SOVITS 预设里面该怎么填才能读取到wav路径和参考文本内容 不会代码所以没看懂/(ㄒoㄒ)
填自己在config.yaml里面的预设语音的default就可以了,而且我上面也说了preset是参考音频预设。 例如:
您可以使用它来教一下,GPT-SOVITS 预设里面该怎么填才能读取到wav路径和参考文本内容 不会代码所以没看懂/(ㄒoㄒ) 这里:https://cdn.statically.io/gh/Ameryou/picx-images-hosting@master/20240612/GPT-SOVITS_preset.1758kmm7y4.png
填自己在config.yaml里面的预设语音的default就可以了,而且我上面也说了preset是参考音频预设。 例如:
感谢大佬
Expected behavior 预期的功能
目前的vits-simple-api功能,我只能使用 BERT-VITS2 和 VITS,但是我感觉GPT-SOVITS的效果更好一些
Alternative behavior (optional) 近似的功能(可选)
我在 vitsSimpleAPI.py 里面的接口改成以下样子勉强支持了 GPT-SOVITS 但是很局限。 局限:GPT-SOVITS 生成语音需要提前选一段语音作为参考,preset=default5 就是自己的参考音频预设,所以每次想换模型的时候都要自己去对应代码里面改参考音频预设,所以能不能实现类似于 vits-simple-api 一样的切到 GPT-SOVITS 模型就能够自己选参考语音? 我修改的接口代码: f"http://127.0.0.1:23456/voice/{model}?text={encoded_content}&id={idx}&lang=auto&format=wav" \ if model != "gpt-sovits" \ else f"http://127.0.0.1:23456/voice/{model}?id={idx}&prompt_lang=auto&preset=default5&text={encoded_content}"