OlaWod / FreeVC

FreeVC: Towards High-Quality Text-Free One-Shot Voice Conversion
MIT License
602 stars 111 forks source link

关于训练问题 #84

Open Aydous opened 1 year ago

Aydous commented 1 year ago

我在测试说话人相似度的时候发现训练集和在LibriTTS的train-clean-100上测得的平均相似度很接近,是因为提供的pt文件是已经在LibriTTS上已经fine-tune好的吗?还是我测试说话人相似度的方法不太合适?我用的是该项目自带的pretrained speaker encoder提的emb vector计算转换后的语音和参考音频之间的余弦相似度。