jianchang512 / ChatTTS-ui

一个简单的本地网页界面,使用ChatTTS将文字合成为语音,同时支持对外提供API接口。A simple native web interface that uses ChatTTS to synthesize text into speech, along with support for external API interfaces.
https://pyvideotrans.com
Other
5.98k stars 687 forks source link

BUG:长文本的音色是乱的,不固定 #136

Closed louyongjiu closed 3 months ago

louyongjiu commented 3 months ago

长文本的音色是乱的,不固定

jianchang512 commented 3 months ago
  1. 多长的文本
  2. 结果是几个音色

截图使用的各项配置,粘贴使用的全部文本

louyongjiu commented 3 months ago

音色有轻微的差别 感觉像是声音大小不同

jianchang512 commented 3 months ago

音调发生变化,这个ChatTTS本身就存在,为了适应长文本,会自动将期按照150-200字数分割为多行,然后批量推理。虽然参数相同,但每次推理音色都会有微小变化,也就是音色无法非常稳定。