Open anye1235 opened 7 months ago
先準備metadata.list然後呼叫preprocess_text.py,最後會生成train.list及val.list,data_util.py是讀這兩個
请问,有台湾那边训练的声音吗?目前的chinese对台湾口音支持的并不好,不像。 如果有,能分享一下训练方法吗
请问,有台湾那边训练的声音吗?目前的chinese对台湾口音支持的并不好,不像。 如果有,能分享一下训练方法吗
抱歉,我手邊都是私有的資料集無法提供給你。 訓練方式基本上可以照教學去做即可。
我看了一下教程,大概如下:
path/to/audio_001.wav |
python preprocess_text.py --metadata data/example/metadata.list
bash train.sh <path/to/config.json>
python infer.py --text "
您那边能提供一些台湾普通wav文件吗?或者是我应该取哪里下载这些数据集?
另外,-m /path/to/checkpoint/G_
@zhjygit 抱歉我無法提供。另外台灣幾乎沒有公開資料集,也無法提供連結給你。 G_.pth是你訓練的checkpoint,如果你還沒開始訓練你不會看到
训练代码异常: 按照readme 里的训练数据格式 metadata.list的格式为:processed_1.wav|Character1|ZH|好運不會在人家等候的那個地方自然來,而是經過彎彎曲曲,與困難的難以想像的道路才降臨的
但是code里的 data_util.py _filter函数解析 _id, spk, language, text, phones, tone, word2ph = item;里面的phones 是否跳过的逻辑。导致解析错误。 我尝试在metadata.list里增加 phones, tone, word2ph空字符也是有问题,还请补充训练的必要数据格式,还是使用train.sh 使用错错误