aliyun / alibabacloud-bailian-speech-demo

Sample Repository for the AlibabaCloud Bailian Speech SDK
https://help.aliyun.com/zh/dashscope/developer-reference/speech-understanding-and-synthesis
MIT License
39 stars 1 forks source link

阿里云百炼 - 通义语音大模型 - 开发示例代码

本仓库以示例代码的形式向开发者展示如何通过阿里云百炼调用通义语音大模型(包括CosyVoiceParaformerSenseVoice等),从而实现语音识别(语音转文字)、语音生成(文字转语音)等基础功能。以及如何结合阿里云百炼支持的大语言模型(包括通义千问、百川、月之暗面、零一万物、MiniMax等),从而实现语音聊天对话语音分析理解语音翻译等高阶AI功能。

开发者可以通过阿里云百炼提供的模型调用 :moneybag: 免费额度 :moneybag: 试用本仓库中的各个示例,还可以直接将这些示例集成进自己的项目中进一步开发。在开发过程中如有任何疑问,都可以通过我们的钉钉 / 微信群进行沟通交流。

⭐最新动态⭐

2024/08/14

更多历史发布信息请见变更记录

:point_right: 示例获取和准备工作

:point_right: 应用场景与开发示例

典型用法 使用说明 开发示例
麦克风语音识别 实时从麦克风录音并进行语音识别 麦克风实时语音识别
音视频文件语音识别 对音视频文件进行语音识别 单个音视频文件语音识别
语音合成 将文字合成为语音并保存到文件 语音合成并保存(简单模式)

:point_right: 常见问题

常见问题请参考QA文档

:point_right: 许可协议

本项目遵循The MIT License开源协议

:point_right: 变更记录

2024/08/14

2024/08/07

2024/07/24

2024/07/19

2024/07/17

2024/07/05

2024/06/25