这几个模型名到底都能填写什么？

modelscope / FunASR

A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Recognition, Voice Activity Detection, Text Post-processing etc.

Other

6.95k stars 738 forks source link

❓ Questions and Help

各位老师好。不断尝试和看文档也没看懂这些模型名到底都有哪些选择呢？

model="iic/speech_paraformer-large-vad-punc-spk_asr_nat-zh-cn", vad_model="fsmn-vad", vad_model_revision="v2.0.4", punc_model="ct-punc-c", punc_model_revision="v2.0.4", spk_model="cam++"

摩搭上的模型都有哪些支持哪些不支持？怎么找到呢？具体名字应该写哪个？例如说话人确认这个模型我想用eres2net这个模型，我写啥名写啥都告诉我没注册。

model="iic/speech_paraformer-large-vad-punc-spk_asr_nat-zh-cn", vad_model="fsmn-vad", vad_model_revision="v2.0.4", punc_model="ct-punc-c", punc_model_revision="v2.0.4", spk_model="cam++" 这是一个语音识别系统的配置。

model参数用来指定用于语音识别的主要模型："speech_paraformer"说明是基于Transformer架构（应该），"large"说明是一个大型模型，"vad-punc-spk"说明该模型集成了语音活动检测VAD、标点预测punc、说话人识别spk的功能，"zh-cn"说明是针对中文。

vad_model参数用来指定语音活动检测vad的模型。vad_model_revision指定vad模型版本。 punc_model、spk_model同理。

"fsmn-vad"、"ct-punc-c"更具体的模型名称和路径可以在 FunASR/examples/industrial_data_pretraining/fsmn_kws/funasr/download/name_maps_from_hub.py 这个文件里看到。

modelscope / FunASR

这几个模型名到底都能填写什么？ #2026

❓ Questions and Help