ripperhe / Bob

Bob 是一款 macOS 平台的翻译和 OCR 软件。
https://bobtranslate.com
8.99k stars 512 forks source link

Azure的语言合成在重复播放相同的文本时,每次的响应速度太慢,希望采用缓存机制 #526

Open CHExN opened 1 year ago

CHExN commented 1 year ago

有些人用 Bob 其实是想更方便的练习口语,需要重复的点击播放按钮,听语音。系统内置的语言合成服务太拉了,所以转用了发音更精准的第三方语音合成服务。

我使用的是 Azure,即使选择了东亚地区,接口的响应速度还是不太理想,大概在 400~900 ms 之间(响应速度受网络与字节数量所影响)还无法达到无感知的 200 ms 以内。所以每次重复点击播放按钮时,总觉得卡卡的。

所以我希望可以改善一下这一点,这是我的些建议:在使用非离线的语音合成时,把最新的播放的语音缓存起来,监测再次点击播放按钮,当前所要传输的文本和缓存音频对应的文本相同,则直接使用缓存中的语音。