语音库是否可以增加ElevenLabs的TTS

cgnannan commented 1 year ago

大佬好，最近在测试咱们家的微信机器人，当前版本中，TTS体验最好的是azure，但跟ElevenLabs相比，还是稍显逊色。

就想尝试给咱家机器人factory.py增加ElevenLabs的TTS

今天在ElevenLab的官网（https://beta.elevenlabs.io/speech-synthesis）看到他们开放了API，我这个菜鸟试图用azure或google的voice改一个ElevenLab的voice，但没有成功。

1684156881205 1684156920572

本想用咱家的机器人做一个微信里的幼儿外语私教项目，使用azure的tts后，做了一圈调研，普遍反应英语语音回复的质量一般，太机械，没有抑扬顿挫和情绪。所以就尝试去找其他tts解决方案，发现ElevenLabs的TTS效果还不错，就想着是否能把它集成到咱家的机器人里面。

无奈，我是个菜鸟i，看了官网的API，弄半天也没成功，就想起来请教大佬们啦。

lanvent commented 1 year ago

建议先用一个单独的py文件测试下api的调用，成功后再移植到项目里进行测试，可以找下官方有没有提供调用的demo

mari1995 commented 1 year ago

cgnannan commented 1 year ago

在提交中 #1105

感谢大佬PR，真是雪中送炭啊。已经git pull，成功接到Elvenlabs的语音了。

zwdzwdzwd commented 8 months ago

顺便问一下如何选择语音回复的声音模板，openai官方显示有alloy, echo, fable, onyx, nova, shimmer六种声音，但是默认是是alloy的声音，不知道该如何实现，谢谢

cgnannan commented 6 months ago

顺便问一下如何选择语音回复的声音模板，openai官方显示有alloy, echo, fable, onyx, nova, shimmer六种声音，但是默认是是alloy的声音，不知道该如何实现，谢谢

1.把config.py中对应openai的tts字典项拷贝到你自己的config.json中

2.在OpenAI的官网API Reference中，确定speech可以接收的voice参数值

3.输入IDE之前，也可以OpenAI官方的Documentation中试听

4.将你选定的voice名，输入config.json对应的字典项

zhayujie / chatgpt-on-wechat