lenML / Speech-AI-Forge

🍦 Speech-AI-Forge is a project developed around TTS generation model, implementing an API Server and a Gradio-based WebUI.
https://huggingface.co/spaces/lenML/ChatTTS-Forge
GNU Affero General Public License v3.0
710 stars 87 forks source link

[Feature] 界面上增加一个生成音频格式选择功能 #163

Open andywu188 opened 2 days ago

andywu188 commented 2 days ago

确认清单

功能描述

界面上增加一个生成音频格式选择功能

可能的解决方案

希望在界面上增加一个格式设置下拉控件,mp3、wav

andywu188 commented 20 hours ago

除此之外,希望生成的音频比特率和采样率也能界面上设置, 例如: 比特率:64Kbps、128Kbps、256Kbps 采样率:8kHz、‌22.05kHz、‌32kHz、‌44.1kHz、‌48kHz和‌96kHz