Have you tried the performance of the model on the mandarin dataset?

liusongxiang / ppg-vc

PPG-Based Voice Conversion

Apache License 2.0

328 stars 72 forks source link

Have you tried the performance of the model on the mandarin dataset? #13

Open hertz-pj opened 3 years ago

hertz-pj commented 3 years ago

It's a great job and it shown extraordinary results for zero-shot condition. Have you test your model on mandarin datasets?If I want to try on mandarin datasets, which module i need to modify.

madosma commented 2 years ago

First train an ASR model, if necessary, then finetune a speaker recognition model, and you can train directly

ZXLCCCC commented 1 year ago

如有必要，首先训练 ASR 模型，然后微调说话人识别模型，可以直接训练

你好，我想向你请教一些问题，可以吗？如果有机会的话。

madosma commented 1 year ago

如有必要，首先训练 ASR 模型，然后微调说话人识别模型，可以直接训练

你好，我想向你请教一些问题，可以吗？如果有机会的话。

可以交流一下，直接联系就好了，知乎发私信即可，用户名：隐在云端。我每天都会看的

liziru commented 3 months ago

如有必要，首先训练 ASR 模型，然后微调说话人识别模型，可以直接训练

你好，我想向你请教一些问题，可以吗？如果有机会的话。

可以交流一下，直接联系就好了，知乎发私信即可，用户名：隐在云端。我每天都会看的

你好，请问一下如何训练此项目中的ppg，我没有找到训练代码？感谢! @madosma @ZXLCCCC @hertz-pj

madosma commented 2 months ago

如有必要，首先训练 ASR 模型，然后微调说话人识别模型，可以直接训练

你好，我想向你请教一些问题，可以吗？如果有机会的话。

可以交流一下，直接联系就好了，知乎发私信即可，用户名：隐在云端。我每天都会看的

你好，请问一下如何训练此项目中的ppg，我没有找到训练代码？感谢! @madosma @ZXLCCCC @hertz-pj

espnet 训一个asr模型，取encoder的最后一层output即可

liziru commented 2 months ago

如有必要，首先训练 ASR 模型，然后微调说话人识别模型，可以直接训练

你好，我想向你请教一些问题，可以吗？如果有机会的话。

可以交流一下，直接联系就好了，知乎发私信即可，用户名：隐在云端。我每天都会看的

你好，请问一下如何训练此项目中的ppg，我没有找到训练代码？感谢! @madosma @ZXLCCCC @hertz-pj

espnet 训一个asr模型，取encoder的最后一层output即可

感谢大佬！请问你训练的asr模型时间轴是几倍下采样？我使用wenet预训练模型（4倍下采样）提取ppg进行训练发现效果很差可懂度也很差，有什么建议吗。 @madosma