2noise / ChatTTS

A generative speech model for daily dialogue.
https://2noise.com
GNU Affero General Public License v3.0
30.59k stars 3.32k forks source link

多次合成音色不稳定 #539

Open XiaolongJason opened 2 months ago

XiaolongJason commented 2 months ago

使用了固定的音色,也固定了seed,但多次合成音色很不问题。

一句话按标点分割后,分段流式合成,合成完之后听起来音色不够稳定。

random.seed(seed)
np.random.seed(seed)
torch.manual_seed(seed)

spk = torch.load('****.pt', map_location=select_device()).detach()
params_infer_code = ChatTTS.Chat.InferCodeParams(
        spk_emb=spk,
        temperature=0.001
    )
fumiama commented 2 months ago

试试webui,看推理是否稳定。如无问题,可按webui代码来写。

rose07 commented 1 month ago

https://tts.byylook.com/ai/text-to-speech