能将语音合成里面的vits-simple-api功能支持GPT-SOVITS嘛？

HIllya51 / LunaTranslator

Galgame翻译器，支持HOOK、OCR、剪贴板等。Visual Novel Translator , support HOOK / OCR / clipboard

http://docs.lunatranslator.org/

GNU General Public License v3.0

5.08k stars 331 forks source link

能将语音合成里面的vits-simple-api功能支持GPT-SOVITS嘛？ #745

Closed luoliyushu closed 6 months ago

luoliyushu commented 6 months ago

Expected behavior 预期的功能

目前的vits-simple-api功能，我只能使用 BERT-VITS2 和 VITS，但是我感觉GPT-SOVITS的效果更好一些

Alternative behavior (optional) 近似的功能（可选）

我在 vitsSimpleAPI.py 里面的接口改成以下样子勉强支持了 GPT-SOVITS 但是很局限。 1715857140453 局限：GPT-SOVITS 生成语音需要提前选一段语音作为参考，preset=default5 就是自己的参考音频预设，所以每次想换模型的时候都要自己去对应代码里面改参考音频预设，所以能不能实现类似于 vits-simple-api 一样的切到 GPT-SOVITS 模型就能够自己选参考语音？我修改的接口代码： f"http://127.0.0.1:23456/voice/{model}?text={encoded_content}&id={idx}&lang=auto&format=wav" \ if model != "gpt-sovits" \ else f"http://127.0.0.1:23456/voice/{model}?id={idx}&prompt_lang=auto&preset=default5&text={encoded_content}"

HIllya51 commented 6 months ago

https://github.com/HIllya51/LunaTranslator/commit/df5297e67fb583046e0f3574c7327f9bc3fd7e58

Ameryou commented 5 months ago

向您请教一下，GPT-SOVITS preset里面该怎么填才能读取到wav路径和参考文本内容不会代码所以没看懂/(ㄒoㄒ)

这里：https://cdn.statically.io/gh/Ameryou/picx-images-hosting@master/20240612/GPT-SOVITS_preset.1758kmm7y4.png

luoliyushu commented 5 months ago

您可以使用它来教一下，GPT-SOVITS 预设里面该怎么填才能读取到wav路径和参考文本内容不会代码所以没看懂/(ㄒoㄒ)

这里：https://cdn.statically.io/gh/Ameryou/picx-images-hosting@master/20240612/GPT-SOVITS_preset.1758kmm7y4.png

填自己在config.yaml里面的预设语音的default就可以了，而且我上面也说了preset是参考音频预设。例如： 1718249144441

Ameryou commented 5 months ago

您可以使用它来教一下，GPT-SOVITS 预设里面该怎么填才能读取到wav路径和参考文本内容不会代码所以没看懂/(ㄒoㄒ) 这里：https://cdn.statically.io/gh/Ameryou/picx-images-hosting@master/20240612/GPT-SOVITS_preset.1758kmm7y4.png

填自己在config.yaml里面的预设语音的default就可以了，而且我上面也说了preset是参考音频预设。例如：

感谢大佬