Open CHExN opened 1 year ago
有些人用 Bob 其实是想更方便的练习口语,需要重复的点击播放按钮,听语音。系统内置的语言合成服务太拉了,所以转用了发音更精准的第三方语音合成服务。
我使用的是 Azure,即使选择了东亚地区,接口的响应速度还是不太理想,大概在 400~900 ms 之间(响应速度受网络与字节数量所影响)还无法达到无感知的 200 ms 以内。所以每次重复点击播放按钮时,总觉得卡卡的。
所以我希望可以改善一下这一点,这是我的些建议:在使用非离线的语音合成时,把最新的播放的语音缓存起来,监测再次点击播放按钮,当前所要传输的文本和缓存音频对应的文本相同,则直接使用缓存中的语音。
有些人用 Bob 其实是想更方便的练习口语,需要重复的点击播放按钮,听语音。系统内置的语言合成服务太拉了,所以转用了发音更精准的第三方语音合成服务。
我使用的是 Azure,即使选择了东亚地区,接口的响应速度还是不太理想,大概在 400~900 ms 之间(响应速度受网络与字节数量所影响)还无法达到无感知的 200 ms 以内。所以每次重复点击播放按钮时,总觉得卡卡的。
所以我希望可以改善一下这一点,这是我的些建议:在使用非离线的语音合成时,把最新的播放的语音缓存起来,监测再次点击播放按钮,当前所要传输的文本和缓存音频对应的文本相同,则直接使用缓存中的语音。