[BUG:API] 上传Speaker接口，使用tensor来创建音色并且传入了name、gender、describe但是没有写入spkv1.json文件中 - Githubissues

lenML / Speech-AI-Forge

🍦 Speech-AI-Forge is a project developed around TTS generation model, implementing an API Server and a Gradio-based WebUI.

https://huggingface.co/spaces/lenML/ChatTTS-Forge

GNU Affero General Public License v3.0

845 stars 112 forks source link

[BUG:API] 上传Speaker接口，使用tensor来创建音色并且传入了name、gender、describe但是没有写入spkv1.json文件中 #147

Open coutlinx opened 2 months ago

coutlinx commented 2 months ago

确认清单

[X] 我已经阅读过 README.md 和 dependencies.md 文件
[X] 我已经确认之前没有 issue 或 discussion 涉及此 BUG
[X] 我已经确认问题发生在最新代码或稳定版本中

Forge Commit 或者 Tag

main

Python 版本

3.10.14

PyTorch 版本

2.3.1

操作系统信息

Ubuntu SMP PREEMPT_DYNAMIC

BUG 描述

上传Speaker接口，使用tensor来创建音色并且传入了name、gender、describe但是没有写入spkv1.json文件中，

BUG 端点

/v1/speaker/create

复现参数

data = { "name": “新增测试”, "gender": "male", "describe": "新增音色测试", "tensor": [1.2312421,.........,-2.3101] }

期望结果

spkv1.json文件中携带者我data中的name、gender、describe等值

实际结果

spkv1.json文件中除了tensor和id其他的都是空的

错误信息

No response

zhzLuke96 commented 2 months ago

这个接口还不完善，建议手动编辑或者用webui创建 spkv1.json

简单说，这个接口关注度比较低，还没有完全适配新的 spkv1 格式比如api还没有支持参考音频上传文件之类的，所以目前不太建议使用这个api

要创建 spk 目前建议在 webui 中操作（也有单独创建 chattts spk 的 webui tab）

后续会增加更完善的 api 替代这个接口

顺带一提， .spkv1.json 里的这些 文本字段 可以自行用任何编辑器修改