Open kood9 opened 5 months ago
FunASR 是一个用于 ASR 相关任务的引擎或者说是框架,它并没有自己的模型,它支持许多模型的调用,比如 Whisper
他说的应该是阿里那个语音转文字,对于中文,运行速度嘎嘎快,一会儿就好了
他说的应该是阿里那个语音转文字,对于中文,运行速度嘎嘎快,一会儿就好了
阿里的 FunASR 是一个语音识别框架,能够实现许多模型的调用和支持,这其中可能包括 阿里自己的部分模型,但是我不是很清楚你们所说的 中文模型 具体是其中哪一个。 也就是说FunASR 不是某一个具体模型或者应用程序的名称,你们用过的 FunASR 应该是基于某种模型的一个实例,
他说的应该是阿里那个语音转文字,对于中文,运行速度嘎嘎快,一会儿就好了
阿里的 FunASR 是一个语音识别框架,能够实现许多模型的调用和支持,这其中可能包括 阿里自己的部分模型,但是我不是很清楚你们所说的 中文模型 具体是其中哪一个。 也就是说FunASR 不是某一个具体模型或者应用程序的名称,你们用过的 FunASR 应该是基于某种模型的一个实例,
不清楚 我用的也是别人封装好的软件,安装软件后 会自动下载模型,不像是whisper可以手动选择具体哪一个模型。 如果你感兴趣,可以看一下 MediaToolkit 软件链接: 百度网盘链接:https://pan.baidu.com/s/1vRhTOu8aRfegfq_KrbnT0A?pwd=whtx 123网盘链接:https://www.123pan.com/s/HA6HTd-3y46d.html提取码:whtx
还有一个是在github上的项目 https://github.com/MrXnneHang/Auto_Caption_Generated_Offline
FunASR模型在中文识别方面速度很快,而且准确度也很高。能够做到中文用FunASR,其他语种用whisper就完美了。如果能增加的话,希望初始提示词和热词功能也能兼容FunASR热词方案。