Open leavegee opened 2 months ago
model="iic/speech_paraformer-large-vad-punc-spk_asr_nat-zh-cn", vad_model="fsmn-vad", vad_model_revision="v2.0.4", punc_model="ct-punc-c", punc_model_revision="v2.0.4", spk_model="cam++" 这是一个语音识别系统的配置。
model参数用来指定用于语音识别的主要模型:"speech_paraformer"说明是基于Transformer架构(应该),"large"说明是一个大型模型,"vad-punc-spk"说明该模型集成了语音活动检测VAD、标点预测punc、说话人识别spk的功能,"zh-cn"说明是针对中文。
vad_model参数用来指定语音活动检测vad的模型。vad_model_revision指定vad模型版本。 punc_model、spk_model同理。
"fsmn-vad"、"ct-punc-c"更具体的模型名称和路径可以在 FunASR/examples/industrial_data_pretraining/fsmn_kws/funasr/download/name_maps_from_hub.py 这个文件里看到。
❓ Questions and Help
各位老师好。 不断尝试和看文档也没看懂 这些模型名到底都有哪些选择呢?
model="iic/speech_paraformer-large-vad-punc-spk_asr_nat-zh-cn", vad_model="fsmn-vad", vad_model_revision="v2.0.4", punc_model="ct-punc-c", punc_model_revision="v2.0.4", spk_model="cam++"
摩搭上的模型都有哪些支持哪些不支持?怎么找到呢?具体名字应该写哪个? 例如说话人确认这个模型我想用eres2net这个模型,我写啥名 写啥都告诉我没注册。