RVC-Boss / GPT-SoVITS

1 min voice data can also be used to train a good TTS model! (few shot voice cloning)
MIT License
29.74k stars 3.44k forks source link

API接口缺乏切分等参数 #1043

Open sancho-t opened 2 months ago

sancho-t commented 2 months ago

API接口缺乏切分等参数,换成inference_webui.py中的get_tts_wav之后,输出音频无效。

sancho-t commented 2 months ago

通过api调用get_tts_wav后,该方法会重复执行两次,没理解,不知道是不是bug

XXXXRT666 commented 2 months ago

可以按指定标点切分,发请求需使用命令或终端而非浏览器

sancho-t commented 2 months ago

您的邮件我已接收,将尽快回复,谢谢!

sancho-t commented 2 months ago

可以按指定标点切分,发请求需使用命令或终端而非浏览器 非常谢谢!在edge中请求api会重复执行两次,换成chrome和用jupyter请求就不会重复了。 但获取到的音频和https://github.com/RVC-Boss/GPT-SoVITS/issues/237#issue-2103314975 这个issures情况一样,我是N卡1660,通过该issues方案,试过之后未能解决问题。

XXXXRT666 commented 2 months ago

半精度问题吧,api得改config.py

XXXXRT666 commented 2 months ago

尝试api传参时候设定fp32看看

sancho-t commented 2 months ago

尝试api传参时候设定fp32看看 多谢多谢,原因找到了,是半精度的问题。之前只修改了config.py中的is_half,但是我调用的inference_webui.py中的get_tts_wav, inference_webui.py 中会从环境变量中获取is_half进行覆盖。两处的is_half都修改之后问题解决了。