Skythinker616 / gpt-assistant-android

免费的ChatGPT API的安卓语音助手,可用音量键唤起并进行语音交流,支持联网、Vision拍照识图、提问模板等功能 | A free ChatGPT API voice assistant for Android, activated via volume keys for voice interaction, supporting features such as network connectivity, Vision photo recognition, and question templates.
GNU General Public License v3.0
665 stars 94 forks source link

语音增加tts和whisper的接口 #32

Open leongxj123 opened 10 months ago

leongxj123 commented 10 months ago

能否增加以下两个功能: 语音增加tts和whisper的接口 同时文件增加个是否带文件的开关,不要限制只能图片,也支持文件上传,并且不限制模型,因为其他模型可能是可以上传文件的

QAbot-zh commented 10 months ago

tts、whisper真的可以有

Skythinker616 commented 10 months ago
  1. whisper接口已在v1.10.0中添加,不过经测试中文识别效果似乎不如默认的华为接口,且该接口不支持流式输出,你可以尝试一下
  2. 大部分手机都自带有tts引擎,而且也可以安装很多第三方的免费tts,因此暂时不考虑添加OpenAI的付费tts
  3. 本软件目前只考虑实现OpenAI格式的接口,它就只支持上传图片。你说的上传文件的接口格式应该不一样吧?你可以举例说明一下