liusongxiang / ppg-vc

PPG-Based Voice Conversion
Apache License 2.0
328 stars 72 forks source link

Have you tried the performance of the model on the mandarin dataset? #13

Open hertz-pj opened 3 years ago

hertz-pj commented 3 years ago

It's a great job and it shown extraordinary results for zero-shot condition. Have you test your model on mandarin datasets?If I want to try on mandarin datasets, which module i need to modify.

madosma commented 2 years ago

First train an ASR model, if necessary, then finetune a speaker recognition model, and you can train directly

ZXLCCCC commented 1 year ago

如有必要,首先训练 ASR 模型,然后微调说话人识别模型,可以直接训练

你好,我想向你请教一些问题,可以吗?如果有机会的话。

madosma commented 1 year ago

如有必要,首先训练 ASR 模型,然后微调说话人识别模型,可以直接训练

你好,我想向你请教一些问题,可以吗?如果有机会的话。

可以交流一下,直接联系就好了,知乎发私信即可,用户名:隐在云端。我每天都会看的

liziru commented 3 months ago

如有必要,首先训练 ASR 模型,然后微调说话人识别模型,可以直接训练

你好,我想向你请教一些问题,可以吗?如果有机会的话。

可以交流一下,直接联系就好了,知乎发私信即可,用户名:隐在云端。我每天都会看的

你好,请问一下如何训练此项目中的ppg,我没有找到训练代码?感谢! @madosma @ZXLCCCC @hertz-pj

madosma commented 2 months ago

如有必要,首先训练 ASR 模型,然后微调说话人识别模型,可以直接训练

你好,我想向你请教一些问题,可以吗?如果有机会的话。

可以交流一下,直接联系就好了,知乎发私信即可,用户名:隐在云端。我每天都会看的

你好,请问一下如何训练此项目中的ppg,我没有找到训练代码?感谢! @madosma @ZXLCCCC @hertz-pj

espnet 训一个asr模型,取encoder的最后一层output即可

liziru commented 2 months ago

如有必要,首先训练 ASR 模型,然后微调说话人识别模型,可以直接训练

你好,我想向你请教一些问题,可以吗?如果有机会的话。

可以交流一下,直接联系就好了,知乎发私信即可,用户名:隐在云端。我每天都会看的

你好,请问一下如何训练此项目中的ppg,我没有找到训练代码?感谢! @madosma @ZXLCCCC @hertz-pj

espnet 训一个asr模型,取encoder的最后一层output即可

感谢大佬!请问你训练的asr模型时间轴是几倍下采样?我使用wenet预训练模型(4倍下采样)提取ppg进行训练发现效果很差可懂度也很差,有什么建议吗。 @madosma