PlayVoice / lora-svc

singing voice change based on whisper, and lora for singing voice clone
MIT License
630 stars 78 forks source link

杂音很重 #55

Open cooldoomsday opened 1 year ago

cooldoomsday commented 1 year ago

按照步骤训练出来的生成杂音很重,会是什么原因

MaxMax2016 commented 1 year ago

训的48K么?现在48K唱低音是有问题,不知道您遇到的是不是这样的问题?

cooldoomsday commented 1 year ago

16k的按照中文的文档来操作的,整个生成的大部分都是杂音

cooldoomsday commented 1 year ago

svc_out(1).wav.zip 这是生成出来的

MaxMax2016 commented 1 year ago

16K的模型要用16K的代码,https://github.com/PlayVoice/lora-svc-16k 这里有备份,您看看是不是16K的代码呢?

MaxMax2016 commented 1 year ago

预训练模型是可以直接推理的,可以用预训练模型试试,需要设置发音人config/singers/****.npy

cooldoomsday commented 1 year ago

预训练模型可以的,那是不是我训练步骤有问题

MaxMax2016 commented 1 year ago

是不是内容编码和提取的pitch不匹配呢?svc_out_pitch.wav正常不?

cooldoomsday commented 1 year ago

svc_out_pitch.wav正常的

MaxMax2016 commented 1 year ago

试试用tensorboard --logdir logs/ 看看训练过程中生成的音频正不正常

cooldoomsday commented 1 year ago

不正常,奇怪了,都听不太见人声,电音加杂音