modelscope / FunASR

A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Recognition, Voice Activity Detection, Text Post-processing etc.
https://www.funasr.com
Other
6.95k stars 738 forks source link

这几个模型名到底都能填写什么? #2026

Open leavegee opened 2 months ago

leavegee commented 2 months ago

❓ Questions and Help

各位老师好。 不断尝试和看文档也没看懂 这些模型名到底都有哪些选择呢?

model="iic/speech_paraformer-large-vad-punc-spk_asr_nat-zh-cn", vad_model="fsmn-vad", vad_model_revision="v2.0.4", punc_model="ct-punc-c", punc_model_revision="v2.0.4", spk_model="cam++" 摩搭上的模型都有哪些支持哪些不支持?怎么找到呢?具体名字应该写哪个? 例如说话人确认这个模型我想用eres2net这个模型,我写啥名 写啥都告诉我没注册。

Djraemon commented 2 weeks ago

model="iic/speech_paraformer-large-vad-punc-spk_asr_nat-zh-cn", vad_model="fsmn-vad", vad_model_revision="v2.0.4", punc_model="ct-punc-c", punc_model_revision="v2.0.4", spk_model="cam++" 这是一个语音识别系统的配置。

model参数用来指定用于语音识别的主要模型:"speech_paraformer"说明是基于Transformer架构(应该),"large"说明是一个大型模型,"vad-punc-spk"说明该模型集成了语音活动检测VAD、标点预测punc、说话人识别spk的功能,"zh-cn"说明是针对中文。

vad_model参数用来指定语音活动检测vad的模型。vad_model_revision指定vad模型版本。 punc_model、spk_model同理。

"fsmn-vad"、"ct-punc-c"更具体的模型名称和路径可以在 FunASR/examples/industrial_data_pretraining/fsmn_kws/funasr/download/name_maps_from_hub.py 这个文件里看到。