Plachtaa / VALL-E-X

An open source implementation of Microsoft's VALL-E X zero-shot TTS model. Demo is available in https://plachtaa.github.io/vallex/
MIT License
7.59k stars 756 forks source link

每次得到不同的语音合成声音 #108

Closed ben-8878 closed 11 months ago

ben-8878 commented 12 months ago

每次推理会得到一个不同的音色,如何固定音色?默认的音色是怎么选择的呢

preload_models()
# generate audio from text
text_prompt = """
新闻联播是中央广播电视总台每日晚间播出的一档新闻节目,被称为中国政坛的风向标,节目宗旨为宣传党和政府的声音,传播天下大事。"""
audio_array = generate_audio(text_prompt,)
Plachtaa commented 12 months ago

不提供prompt的话音色是随机生成的

ben-8878 commented 12 months ago

@Plachtaa 还有就是提供prompt会出现错误的停顿,如何避免呢?删除静音段吗,而且每次合成的效果也不一样(有时候好,有时候差)

BuaaAlban commented 9 months ago

不提供prompt的话音色是随机生成的

但提供同样的音色prompt,好像也会有随机性?