杂音很重 - Githubissues

PlayVoice / lora-svc

singing voice change based on whisper, and lora for singing voice clone

MIT License

630 stars 78 forks source link

Open cooldoomsday opened 1 year ago

cooldoomsday commented 1 year ago

按照步骤训练出来的生成杂音很重，会是什么原因

MaxMax2016 commented 1 year ago

训的48K么？现在48K唱低音是有问题，不知道您遇到的是不是这样的问题？

cooldoomsday commented 1 year ago

16k的按照中文的文档来操作的，整个生成的大部分都是杂音

cooldoomsday commented 1 year ago

svc_out(1).wav.zip 这是生成出来的

MaxMax2016 commented 1 year ago

16K的模型要用16K的代码，https://github.com/PlayVoice/lora-svc-16k 这里有备份，您看看是不是16K的代码呢？

MaxMax2016 commented 1 year ago

预训练模型是可以直接推理的，可以用预训练模型试试，需要设置发音人config/singers/****.npy

cooldoomsday commented 1 year ago

预训练模型可以的，那是不是我训练步骤有问题

MaxMax2016 commented 1 year ago

是不是内容编码和提取的pitch不匹配呢？svc_out_pitch.wav正常不？

cooldoomsday commented 1 year ago

svc_out_pitch.wav正常的

MaxMax2016 commented 1 year ago

试试用tensorboard --logdir logs/ 看看训练过程中生成的音频正不正常

cooldoomsday commented 1 year ago

不正常，奇怪了，都听不太见人声，电音加杂音