Closed welkinchan closed 8 months ago
我看了下2个视频,2款性能的响应延迟相差好大啊。增强版的响应延时好短,是用了离线的whisper吗?另外,智能方面是不是也用了langchain的方案?感觉好强啊,居然流量这么小。增强版有开源的计划吗?好想试试看。
我看了下2个视频,2款性能的响应延迟相差好大啊。增强版的响应延时好短,是用了离线的whisper吗?另外,智能方面是不是也用了langchain的方案?感觉好强啊,居然流量这么小。增强版有开源的计划吗?好想试试看。
- 增强版的延时也比较大,视频经过了剪辑,改为Azure中国可能会好一些,本地部署Whisper也可行,但需要比较强的硬件
- 智能方面没有用langchain,用的是GPT function calling,langchain会更成熟一些,也是基于function calling实现的
- 增强版的代码还需要优化,等有时间优化好了才能开源
我想先进一步了解下目前已经开源的这部分代码。 我成功运行起来后发现, 怎么感觉这部分的代码的语音响应时间比第一个bilibili视频里的响应时间要快很多啊。 而且,目前的代码是不能连续对话的,每次都要唤醒,跟你的视频里的表现也不一样。哈哈。
我看了下2个视频,2款性能的响应延迟相差好大啊。增强版的响应延时好短,是用了离线的whisper吗?另外,智能方面是不是也用了langchain的方案?感觉好强啊,居然流量这么小。增强版有开源的计划吗?好想试试看。
- 增强版的延时也比较大,视频经过了剪辑,改为Azure中国可能会好一些,本地部署Whisper也可行,但需要比较强的硬件
- 智能方面没有用langchain,用的是GPT function calling,langchain会更成熟一些,也是基于function calling实现的
- 增强版的代码还需要优化,等有时间优化好了才能开源
我想先进一步了解下目前已经开源的这部分代码。 我成功运行起来后发现, 怎么感觉这部分的代码的语音响应时间比第一个bilibili视频里的响应时间要快很多啊。 而且,目前的代码是不能连续对话的,每次都要唤醒,跟你的视频里的表现也不一样。哈哈。
这个是演示视频地址,另外还有一个增强版的,还没有开源