每次得到不同的语音合成声音

Plachtaa / VALL-E-X

An open source implementation of Microsoft's VALL-E X zero-shot TTS model. Demo is available in https://plachtaa.github.io/vallex/

MIT License

7.59k stars 756 forks source link

每次得到不同的语音合成声音 #108

Closed ben-8878 closed 11 months ago

ben-8878 commented 12 months ago

每次推理会得到一个不同的音色，如何固定音色？默认的音色是怎么选择的呢

preload_models()
# generate audio from text
text_prompt = """
新闻联播是中央广播电视总台每日晚间播出的一档新闻节目，被称为中国政坛的风向标，节目宗旨为宣传党和政府的声音，传播天下大事。"""
audio_array = generate_audio(text_prompt,)

Plachtaa commented 12 months ago

不提供prompt的话音色是随机生成的

ben-8878 commented 12 months ago

@Plachtaa 还有就是提供prompt会出现错误的停顿，如何避免呢？删除静音段吗，而且每次合成的效果也不一样（有时候好，有时候差）

BuaaAlban commented 9 months ago

不提供prompt的话音色是随机生成的

但提供同样的音色prompt，好像也会有随机性？