wenet-e2e / wetts

Production First and Production Ready End-to-End Text-to-Speech Toolkit
Apache License 2.0
356 stars 56 forks source link

合成有做过流式合成么 #150

Open Pydataman opened 10 months ago

pengzhendong commented 10 months ago

你说的是什么级别的流式呢?句子级别还是帧级别?帧级别的话,flow 没法流式,只能 decoder 流式。

TinaChen95 commented 10 months ago

flow也可以流式,内部都是cnn结构,感受野是固定长度的

pengzhendong commented 9 months ago

flow也可以流式,内部都是cnn结构,感受野是固定长度的

但是 flow 里用了 flip 算子,就需要看全部上下文,所以我才问是什么级别的流式。

Jackiexiao commented 7 months ago

目前在声码器(vocos)上做了流式: https://github.com/wenet-e2e/wetts/tree/main/runtime/cpu_triton_stream