关于FunASR模型 - Githubissues

modelscope / FunClip

Open-source, accurate and easy-to-use video speech recognition & clipping tool, LLM based AI clipping intergrated.

MIT License

3.55k stars 382 forks source link

关于FunASR模型 #94

Closed joseph16388 closed 3 months ago

joseph16388 commented 3 months ago

Hello！目前使用的punc_ct-transformer_zh-cn-common-vocab272727-pytorch，speech_campplus_sv_zh-cn_16k-common，speech_fsmn_vad_zh-cn-16k-common-pytorch这三个模型已经是FunASR系列中最准确三个模型吗？我实测了几个视频下来，生成的字幕和说话人的识别都不是太准确。是否可以通过更换模型提高识别准确度？3Q！

R1ckShi commented 3 months ago

punc模型可以考虑替换为词建模的https://modelscope.cn/models/iic/punc_ct-transformer_cn-en-common-vocab471067-large，可能能够解决部分由于标点模型引入的分句错误。其他的fsmn模型，asr模型和vad模型已经是最优的模型了。

joseph16388 commented 3 months ago

punc模型可以考虑替换为词建模的https://modelscope.cn/models/iic/punc_ct-transformer_cn-en-common-vocab471067-large，可能能够解决部分由于标点模型引入的分句错误。其他的fsmn模型，asr模型和vad模型已经是最优的模型了。

好的，感谢！