labring / FastGPT

FastGPT is a knowledge-based platform built on the LLMs, offers a comprehensive suite of out-of-the-box capabilities such as data processing, RAG retrieval, and visual AI workflow orchestration, letting you easily develop and deploy complex question-answering systems without the need for extensive setup or configuration.
https://tryfastgpt.ai
Other
17.23k stars 4.61k forks source link

自定义TTS模型语音播放时无法试听,对话中需要点击2次才能语音读出 #1984

Closed sipeter closed 2 months ago

sipeter commented 3 months ago

例行检查

你的版本

问题描述, 日志截图

通过api方式接入自定义tts模型时:

  1. 试听无法正常使用;
  2. 对话中语音播放需要点击两次;

复现步骤

我是用gpt sovits 加载的tts模型,通过api方式接入到fastgpt中,当选中模型比如“晓墨”时,第一次点击试听,会生成语音,但并不会播放出声音,之后再点击这个模型,既不会生成语音,也不会播放声音; 选中这个模型为语音播放声音后,在对话中,需要点击2次才能听到声音,第一次生成语音,再次点击才能播放。

对比测试:

  1. openai tts-1 的几个声音模型,点击试听,会生成语音,并自动播放出声音;在对话中,点击语音会生成并同时播放出语音;
  2. 测试另一个tts项目chatTTS,也是通过api方式接入到fastgpt中,与openai tts-1一样,会按照预期正常播放语音。

预期结果

希望能够像openai tts-1和 chatTTS一样,按照预期正常播放语音; fastgpt中语音播放能够实现生成文字同时自动播放语音,不需要点击播放,或者有没有自动播放的的可选设置?

相关截图 image

Goic commented 3 months ago

我也在想方法替换funasr语音模型,docker部署的useSpeech.ts也不知道在哪里,没有相关教程

SDAIer commented 2 months ago

跟进