预训练模型？ - Githubissues

myshell-ai / MeloTTS

High-quality multi-lingual text-to-speech library by MyShell.ai. Support English, Spanish, French, Chinese, Japanese and Korean.

MIT License

3.98k stars 476 forks source link

Closed juntaosun closed 3 months ago

juntaosun commented 3 months ago

download_utils.py

jeremy110 commented 3 months ago

download_utils.py當中有提供底模，當你使用bash train.sh會自動下載

Okkband commented 3 months ago

我也是，训练完之后，一只说胡话，音色是对的，但是文字都不对。

jinqiupeter commented 3 months ago

我也是，训练完之后，一只说胡话，音色是对的，但是文字都不对。

我用一个八分钟的音频训练出来也是一直说胡话，现在在尝试用两个小时的素材训练。

你们用多少素材训练的？作者在另一个issue里面说至少要几个小时的音频

jeremy110 commented 3 months ago

@juntaosun @Okkband @jinqiupeter 照範例是說支援六種語言我另外一位同事有訓練中文，大概是10小時，可以出來正常的文字及音色，但韻律差了一點

Okkband commented 3 months ago

但是GPT-Sovits只需要几十句话就能得到效果好的音色，只不过GPT-Sovits推理会慢很多。

Coder0015 commented 2 months ago

@juntaosun @Okkband @jinqiupeter 照範例是說支援六種語言我另外一位同事有訓練中文，大概是10小時，可以出來正常的文字及音色，但韻律差了一點

想请教一下，是因为数据集的量或是因为config文件参数的问题吗？我不管怎么训，吐字都不怎么标准且有些字连发音都完全不对。

jeremy110 commented 2 months ago

@Coder0015 或許跟這個有關係https://github.com/myshell-ai/MeloTTS/issues/83