Plachtaa / VALL-E-X

An open source implementation of Microsoft's VALL-E X zero-shot TTS model. Demo is available in https://plachtaa.github.io/vallex/
MIT License
7.7k stars 765 forks source link

关于 VALL-E X 批量推理 的询问~ #181

Open CamellIyquitous opened 1 month ago

CamellIyquitous commented 1 month ago

大家好,我是一名目前在学习研究 TTS 的学生。

我想请问 VALL-E X 可以批量推理吗?

我的目的是:批量地输入 speaker audio prompt (referennce) 和对应文本的 text prompt (reference),同时批量地输入目标文本 text (target),最后批量地生成对应的合成结果 speech (target) ~

请问 VALL-E X 有办法实现上面的效果吗?非常感谢!

Plachtaa commented 1 month ago

可以的,但是脚本需要你自己写

CamellIyquitous commented 1 month ago

大佬您好,请问可以提供一下思路吗?(由于本人代码水平和经验都实在一般~ QAQ) 我看 VALL-E X 下面没有 api 接口,我自己一般的经验是开两个终端,一种终端开启 api 接口,另一个终端运行脚本调用 api 接口来实现批量推理。

如果大佬可以提供一些思路点拨的话,非常非常感谢!