FunAudioLLM / CosyVoice

Multi-lingual large voice generation model, providing inference, training and deployment full-stack ability.
https://funaudiollm.github.io/
Apache License 2.0
6.47k stars 698 forks source link

流式合成有电音输出,如何解决 #631

Open doudou0601 opened 2 weeks ago

doudou0601 commented 2 weeks ago

使用流式合成接口,每小段语音结尾有电音,该如何解决

aluminumbox commented 2 weeks ago

跟训练数据有关,可以考虑自己再结尾加上一点静音然后平滑处理

genicsoft commented 2 weeks ago

结尾自己加200ms 静音,就好了。

doudou0601 commented 2 weeks ago

可能我描述的问题有误,应该说不是电音,是有点卡顿 ,如果加上静音只会让卡顿更明显,整个语音播放不连贯。附件是没有加静音合成的效果,已经有明显的卡顿。 test.wav.webm

lucasjinreal commented 1 week ago

同样有这个问题,请问楼主解决了吗?

doudou0601 commented 1 week ago

还没有解决,末尾加静音 只会让停顿更长,整个语音就不连贯了。