训练代码异常 - Githubissues

myshell-ai / MeloTTS

High-quality multi-lingual text-to-speech library by MyShell.ai. Support English, Spanish, French, Chinese, Japanese and Korean.

MIT License

4.91k stars 637 forks source link

训练代码异常 #99

Open anye1235 opened 7 months ago

anye1235 commented 7 months ago

训练代码异常：按照readme 里的训练数据格式 metadata.list的格式为：processed_1.wav|Character1|ZH|好運不會在人家等候的那個地方自然來，而是經過彎彎曲曲，與困難的難以想像的道路才降臨的

但是code里的 data_util.py _filter函数解析 _id, spk, language, text, phones, tone, word2ph = item；里面的phones 是否跳过的逻辑。导致解析错误。我尝试在metadata.list里增加 phones, tone, word2ph空字符也是有问题，还请补充训练的必要数据格式，还是使用train.sh 使用错错误

jeremy110 commented 7 months ago

先準備metadata.list然後呼叫preprocess_text.py，最後會生成train.list及val.list，data_util.py是讀這兩個

zhjygit commented 6 months ago

请问，有台湾那边训练的声音吗？目前的chinese对台湾口音支持的并不好，不像。如果有，能分享一下训练方法吗

jeremy110 commented 6 months ago

请问，有台湾那边训练的声音吗？目前的chinese对台湾口音支持的并不好，不像。如果有，能分享一下训练方法吗

抱歉，我手邊都是私有的資料集無法提供給你。訓練方式基本上可以照教學去做即可。

zhjygit commented 6 months ago

我看了一下教程，大概如下： path/to/audio_001.wav ||| path/to/audio_002.wav |||

python preprocess_text.py --metadata data/example/metadata.list

bash train.sh <path/to/config.json>

python infer.py --text "" -m /path/to/checkpoint/G_.pth -o

您那边能提供一些台湾普通wav文件吗？或者是我应该取哪里下载这些数据集？另外，-m /path/to/checkpoint/G_.pth 这里的pth我应该应哪个呀

jeremy110 commented 6 months ago

@zhjygit 抱歉我無法提供。另外台灣幾乎沒有公開資料集，也無法提供連結給你。 G_.pth是你訓練的checkpoint，如果你還沒開始訓練你不會看到