myshell-ai / MeloTTS

High-quality multi-lingual text-to-speech library by MyShell.ai. Support English, Spanish, French, Chinese, Japanese and Korean.
MIT License
3.98k stars 476 forks source link

预训练模型? #66

Closed juntaosun closed 3 months ago

juntaosun commented 3 months ago

download_utils.py

jeremy110 commented 3 months ago

download_utils.py當中有提供底模,當你使用bash train.sh會自動下載

Okkband commented 3 months ago

我也是, 训练完之后,一只说胡话,音色是对的,但是文字都不对。

jinqiupeter commented 3 months ago

我也是, 训练完之后,一只说胡话,音色是对的,但是文字都不对。

我用一个八分钟的音频训练出来也是一直说胡话,现在在尝试用两个小时的素材训练。

你们用多少素材训练的?作者在另一个issue里面说至少要几个小时的音频

jeremy110 commented 3 months ago

@juntaosun @Okkband @jinqiupeter 照範例是說支援六種語言 我另外一位同事有訓練中文,大概是10小時,可以出來正常的文字及音色,但韻律差了一點

Okkband commented 3 months ago

但是GPT-Sovits只需要几十句话就能得到效果好的音色,只不过GPT-Sovits推理会慢很多。

Coder0015 commented 2 months ago

@juntaosun @Okkband @jinqiupeter 照範例是說支援六種語言 我另外一位同事有訓練中文,大概是10小時,可以出來正常的文字及音色,但韻律差了一點

想请教一下,是因为数据集的量或是因为config文件参数的问题吗?我不管怎么训,吐字都不怎么标准且有些字连发音都完全不对。

jeremy110 commented 2 months ago

@Coder0015 或許跟這個有關係https://github.com/myshell-ai/MeloTTS/issues/83