babysor / MockingBird

🚀AI拟声: 5秒内克隆您的声音并生成任意语音内容 Clone a voice in 5 seconds to generate arbitrary speech in real-time
Other
34.88k stars 5.18k forks source link

训练wavernn时报错 #863

Closed lfgogogo closed 1 year ago

lfgogogo commented 1 year ago

我完成了vocoder的数据处理,运行训练脚本后如下报错 228773388-0f02de94-f70e-48c0-87a0-0db4b1068d2f 我看了下两个hparams文件,wavernn里面的是558,累乘200,syn的是256,确实不一样 于是我直接把assert注释掉,有了下面的报错 228774557-2075b5af-3111-4990-b423-6777690a9d5f 这个参数会影响到后面Upsample的维度,于是我修改syn参数里的256为200,重新做数据预处理,虽然不报错,但是训练出来的模型推理出来都是杂音 按道理来说syn和wavernn的预训练模型参数也是不一样的,为什么预训练模型预测起来没有问题,但是训练起来这两个参数就有冲突了,麻烦大佬指点一下。