OlaWod / FreeVC

FreeVC: Towards High-Quality Text-Free One-Shot Voice Conversion
MIT License
603 stars 111 forks source link

音色转换程度不一致 #74

Open liubin3702 opened 1 year ago

liubin3702 commented 1 year ago

我用中文数据200个speaker训练了800k steps 后,用不同的source 转为同一个target 音色差距较大,音色基本是跟着source类似,是训练程度还不够嘛,能继续做什么改进呢?

Blakey-Gavin commented 1 month ago

你好,我也遇到了和您类似的情况,转换后的音色基本是跟着 source 走的。请问您后来发现是什么原因,解决了吗?

而且,ssl model 我替换为了中文版的 wav2vec2/hubert,不管是 retrain 还是 fine-tune 结果都是这样。