Open zhanghx0905 opened 2 months ago
这个docker镜像能离线部署和运行吗?
这个docker镜像能离线部署和运行吗?
可以。我希望修改fastgpt,适配funasr的websocket接口,在此寻求社区的帮助
这个docker镜像能离线部署和运行吗?
可以。我希望修改fastgpt,适配funasr的websocket接口,在此寻求社区的帮助
我pull你的镜像,跑了一下,确实很棒,fastgpt如果能集成适配接入你的websocket asr接口,语音输入体验一下子就高层次了,和智能就沾边了。 另外,问一下,你这镜像里的funasr是CPU版本的还是GPU版本的?
这个docker镜像能离线部署和运行吗?
可以。我希望修改fastgpt,适配funasr的websocket接口,在此寻求社区的帮助
直接修改成whisper 接口不就好了。线上都已经全部替换 funasr 了,拉阿里的代码,fastapi 改改完事~
直接修改成whisper 接口不就好了。线上都已经全部替换 funasr 了,拉阿里的代码,fastapi 改改完事~
Whisper 的 API 不是实时流式识别,在语音输入结束之前,用户看不到自己说了什么;这与 funasr WebSocket 的实时识别还是有很大不同的。
WebSocketApp
不一定好,实时转,发现一个字错了,会打断讲话思路
流式传输在某些场景下确实有优势,可以考虑提供为一个可选功能
流式传输在某些场景下确实有优势,可以考虑提供为一个可选功能
大佬,实现了吗?
流式传输在某些场景下确实有优势,可以考虑提供为一个可选功能
大佬,实现了吗?
没有,我目前觉得openai api的效果在识别足够准确时也不错,不搞流式了
这个在转写的过程中会自动纠错吗? 类似讯飞的实时转写接口那样
测试了下应该是不能
这个在转写的过程中会自动纠错吗? 类似讯飞的实时转写接口那样
测试了下应该不能
例行检查
功能描述
当前的系统使用 Whisper 进行离线语音转录,这种方式存在中文效果一般,延迟大的问题。为了保证语音转录的实时性,提高用户体验,建议将现有的 Whisper 离线转录替换为 FunASR 实时语音转录。FunASR 提供了高效的实时语音转录功能,能够在保证准确率的同时,大幅度减少延迟。
应用场景
会议转录: 在在线会议和网络研讨会中,实时转录能够让与会者及时看到讲话内容,便于记录和后续讨论。
实时客服: 实时转录客户的对话,提高客户体验。
相关示例
为了便于集成和部署,可以使用已经打包成容器的 FunASR 实时语音转录 API,参见 https://harryai.cc/post/realtime-funasr/
这是一个为 harryliu888/funasr-online-server:latest 编写的客户端脚本,实时获取麦克风输入并转录: