myshell-ai / MeloTTS

High-quality multi-lingual text-to-speech library by MyShell.ai. Support English, Spanish, French, Chinese, Japanese and Korean.
MIT License
3.98k stars 476 forks source link

训练代码异常 #99

Open anye1235 opened 2 months ago

anye1235 commented 2 months ago

训练代码异常: 按照readme 里的训练数据格式 metadata.list的格式为:processed_1.wav|Character1|ZH|好運不會在人家等候的那個地方自然來,而是經過彎彎曲曲,與困難的難以想像的道路才降臨的

但是code里的 data_util.py _filter函数解析 _id, spk, language, text, phones, tone, word2ph = item;里面的phones 是否跳过的逻辑。导致解析错误。 我尝试在metadata.list里增加 phones, tone, word2ph空字符也是有问题,还请补充训练的必要数据格式,还是使用train.sh 使用错错误

jeremy110 commented 2 months ago

先準備metadata.list然後呼叫preprocess_text.py,最後會生成train.list及val.list,data_util.py是讀這兩個

zhjygit commented 1 month ago

请问,有台湾那边训练的声音吗?目前的chinese对台湾口音支持的并不好,不像。 如果有,能分享一下训练方法吗

jeremy110 commented 1 month ago

请问,有台湾那边训练的声音吗?目前的chinese对台湾口音支持的并不好,不像。 如果有,能分享一下训练方法吗

抱歉,我手邊都是私有的資料集無法提供給你。 訓練方式基本上可以照教學去做即可。

zhjygit commented 1 month ago

我看了一下教程,大概如下: path/to/audio_001.wav ||| path/to/audio_002.wav |||

python preprocess_text.py --metadata data/example/metadata.list

bash train.sh <path/to/config.json>

python infer.py --text "" -m /path/to/checkpoint/G_.pth -o

您那边能提供一些台湾普通wav文件吗?或者是我应该取哪里下载这些数据集? 另外,-m /path/to/checkpoint/G_.pth 这里的pth我应该应哪个呀

jeremy110 commented 1 month ago

@zhjygit 抱歉我無法提供。另外台灣幾乎沒有公開資料集,也無法提供連結給你。 G_.pth是你訓練的checkpoint,如果你還沒開始訓練你不會看到