modelscope / FunClip

Open-source, accurate and easy-to-use video speech recognition & clipping tool, LLM based AI clipping intergrated.
MIT License
3.55k stars 382 forks source link

关于FunASR模型 #94

Closed joseph16388 closed 3 months ago

joseph16388 commented 3 months ago

Hello! 目前使用的punc_ct-transformer_zh-cn-common-vocab272727-pytorch,speech_campplus_sv_zh-cn_16k-common,speech_fsmn_vad_zh-cn-16k-common-pytorch这三个模型已经是FunASR系列中最准确三个模型吗?我实测了几个视频下来,生成的字幕和说话人的识别都不是太准确。是否可以通过更换模型提高识别准确度?3Q!

R1ckShi commented 3 months ago

punc模型可以考虑替换为词建模的https://modelscope.cn/models/iic/punc_ct-transformer_cn-en-common-vocab471067-large,可能能够解决部分由于标点模型引入的分句错误。其他的fsmn模型,asr模型和vad模型已经是最优的模型了。

joseph16388 commented 3 months ago

punc模型可以考虑替换为词建模的https://modelscope.cn/models/iic/punc_ct-transformer_cn-en-common-vocab471067-large,可能能够解决部分由于标点模型引入的分句错误。其他的fsmn模型,asr模型和vad模型已经是最优的模型了。

好的,感谢!