Open hertz-pj opened 3 years ago
First train an ASR model, if necessary, then finetune a speaker recognition model, and you can train directly
如有必要,首先训练 ASR 模型,然后微调说话人识别模型,可以直接训练
你好,我想向你请教一些问题,可以吗?如果有机会的话。
如有必要,首先训练 ASR 模型,然后微调说话人识别模型,可以直接训练
你好,我想向你请教一些问题,可以吗?如果有机会的话。
可以交流一下,直接联系就好了,知乎发私信即可,用户名:隐在云端。我每天都会看的
如有必要,首先训练 ASR 模型,然后微调说话人识别模型,可以直接训练
你好,我想向你请教一些问题,可以吗?如果有机会的话。
可以交流一下,直接联系就好了,知乎发私信即可,用户名:隐在云端。我每天都会看的
你好,请问一下如何训练此项目中的ppg,我没有找到训练代码?感谢! @madosma @ZXLCCCC @hertz-pj
如有必要,首先训练 ASR 模型,然后微调说话人识别模型,可以直接训练
你好,我想向你请教一些问题,可以吗?如果有机会的话。
可以交流一下,直接联系就好了,知乎发私信即可,用户名:隐在云端。我每天都会看的
你好,请问一下如何训练此项目中的ppg,我没有找到训练代码?感谢! @madosma @ZXLCCCC @hertz-pj
espnet 训一个asr模型,取encoder的最后一层output即可
如有必要,首先训练 ASR 模型,然后微调说话人识别模型,可以直接训练
你好,我想向你请教一些问题,可以吗?如果有机会的话。
可以交流一下,直接联系就好了,知乎发私信即可,用户名:隐在云端。我每天都会看的
你好,请问一下如何训练此项目中的ppg,我没有找到训练代码?感谢! @madosma @ZXLCCCC @hertz-pj
espnet 训一个asr模型,取encoder的最后一层output即可
感谢大佬!请问你训练的asr模型时间轴是几倍下采样?我使用wenet预训练模型(4倍下采样)提取ppg进行训练发现效果很差可懂度也很差,有什么建议吗。 @madosma
It's a great job and it shown extraordinary results for zero-shot condition. Have you test your model on mandarin datasets?If I want to try on mandarin datasets, which module i need to modify.