lenML / Speech-AI-Forge

🍦 Speech-AI-Forge is a project developed around TTS generation model, implementing an API Server and a Gradio-based WebUI.
https://huggingface.co/spaces/lenML/ChatTTS-Forge
GNU Affero General Public License v3.0
845 stars 112 forks source link

[BUG:API] 上传Speaker接口,使用tensor来创建音色并且传入了name、gender、describe但是没有写入spkv1.json文件中 #147

Open coutlinx opened 2 months ago

coutlinx commented 2 months ago

确认清单

Forge Commit 或者 Tag

main

Python 版本

3.10.14

PyTorch 版本

2.3.1

操作系统信息

Ubuntu SMP PREEMPT_DYNAMIC

BUG 描述

上传Speaker接口,使用tensor来创建音色并且传入了name、gender、describe但是没有写入spkv1.json文件中,

BUG 端点

/v1/speaker/create

复现参数

data = { "name": “新增测试”, "gender": "male", "describe": "新增音色测试", "tensor": [1.2312421,.........,-2.3101] }

期望结果

spkv1.json文件中携带者我data中的name、gender、describe等值

实际结果

spkv1.json文件中除了tensor和id其他的都是空的

错误信息

No response

zhzLuke96 commented 2 months ago

这个接口还不完善,建议手动编辑或者用webui创建 spkv1.json


简单说,这个接口关注度比较低,还没有完全适配新的 spkv1 格式 比如api还没有支持参考音频上传文件之类的,所以目前不太建议使用这个api

要创建 spk 目前建议在 webui 中操作 (也有单独创建 chattts spk 的 webui tab)

后续会增加更完善的 api 替代这个接口

顺带一提, .spkv1.json 里的这些 文本字段 可以自行用任何编辑器修改