2noise / ChatTTS

A generative speech model for daily dialogue.
https://2noise.com
GNU Affero General Public License v3.0
31.21k stars 3.39k forks source link

有没有其他推荐的开源TTS,可以做到流式或者低延迟响应的,chattts的速度实在是慢 #279

Closed chwyxy closed 3 months ago

chwyxy commented 4 months ago

我在A100上运行的chattts,生成长文本需要很长时间,后面尝试去做文本分割,一段段的生成,速度也还是不行,之前实现了基于paddlespeech的语音合成,流式的效果很好,但是音色比较拉跨,有没有合成效果不那么拉跨,而且速度还可以的tts推荐

teressawang commented 4 months ago

bert bits 2 试过没?

QuantumDriver commented 4 months ago

tts 实测4090显卡下15秒生成2分钟的音频(批处理后再合并,显存占用12G)

lphkxd commented 4 months ago

目前我用的vits2

chwyxy commented 4 months ago

tts 实测4090显卡下15秒生成2分钟的音频(批处理后再合并,显存占用12G)

可以提供一下代码吗,我这边测试没有这么快的速度,还是很慢

hoveychen commented 4 months ago

ChatTTS的延时比较严重,单纯批处理速度还行。如果要低延时,估计得改代码做流式输出,对于自回归模型,大概是可能可以做到的