Open cooldoomsday opened 1 year ago
训的48K么?现在48K唱低音是有问题,不知道您遇到的是不是这样的问题?
16k的按照中文的文档来操作的,整个生成的大部分都是杂音
svc_out(1).wav.zip 这是生成出来的
16K的模型要用16K的代码,https://github.com/PlayVoice/lora-svc-16k 这里有备份,您看看是不是16K的代码呢?
预训练模型是可以直接推理的,可以用预训练模型试试,需要设置发音人config/singers/****.npy
预训练模型可以的,那是不是我训练步骤有问题
是不是内容编码和提取的pitch不匹配呢?svc_out_pitch.wav正常不?
svc_out_pitch.wav正常的
试试用tensorboard --logdir logs/ 看看训练过程中生成的音频正不正常
不正常,奇怪了,都听不太见人声,电音加杂音
按照步骤训练出来的生成杂音很重,会是什么原因