CheshireCC / faster-whisper-GUI

faster_whisper GUI with PySide6
GNU Affero General Public License v3.0
1.69k stars 104 forks source link

希望能增加对FunASR模型的支持 #167

Open kood9 opened 5 months ago

kood9 commented 5 months ago

FunASR模型在中文识别方面速度很快,而且准确度也很高。能够做到中文用FunASR,其他语种用whisper就完美了。如果能增加的话,希望初始提示词和热词功能也能兼容FunASR热词方案。

CheshireCC commented 5 months ago

FunASR 是一个用于 ASR 相关任务的引擎或者说是框架,它并没有自己的模型,它支持许多模型的调用,比如 Whisper

zuiaiyutu commented 2 months ago

他说的应该是阿里那个语音转文字,对于中文,运行速度嘎嘎快,一会儿就好了

CheshireCC commented 2 months ago

他说的应该是阿里那个语音转文字,对于中文,运行速度嘎嘎快,一会儿就好了

阿里的 FunASR 是一个语音识别框架,能够实现许多模型的调用和支持,这其中可能包括 阿里自己的部分模型,但是我不是很清楚你们所说的 中文模型 具体是其中哪一个。 也就是说FunASR 不是某一个具体模型或者应用程序的名称,你们用过的 FunASR 应该是基于某种模型的一个实例,

zuiaiyutu commented 2 months ago

他说的应该是阿里那个语音转文字,对于中文,运行速度嘎嘎快,一会儿就好了

阿里的 FunASR 是一个语音识别框架,能够实现许多模型的调用和支持,这其中可能包括 阿里自己的部分模型,但是我不是很清楚你们所说的 中文模型 具体是其中哪一个。 也就是说FunASR 不是某一个具体模型或者应用程序的名称,你们用过的 FunASR 应该是基于某种模型的一个实例,

不清楚 我用的也是别人封装好的软件,安装软件后 会自动下载模型,不像是whisper可以手动选择具体哪一个模型。 如果你感兴趣,可以看一下 MediaToolkit 软件链接: 百度网盘链接:https://pan.baidu.com/s/1vRhTOu8aRfegfq_KrbnT0A?pwd=whtx 123网盘链接:https://www.123pan.com/s/HA6HTd-3y46d.html提取码:whtx

还有一个是在github上的项目 https://github.com/MrXnneHang/Auto_Caption_Generated_Offline