lipku / metahuman-stream

Real time interactive streaming digital human
https://livetalking-doc.readthedocs.io/
Apache License 2.0
3.54k stars 499 forks source link

大佬,tts我是用的是gpt-sovits。数字人说话时有一顿一顿的杂音,类似电流麦的声音?直接接口调用gpt-sovits的接口没有这种情况发生。 #260

Open Proletariat-wh opened 1 week ago

Proletariat-wh commented 1 week ago

大佬,tts我是用的是gpt-sovits。数字人说话时有一顿一顿的杂音,类似电流麦的声音?直接接口调用gpt-sovits的接口没有这种情况发生。

Proletariat-wh commented 1 week ago

数字人用的是ER-NeRF,使用edgetts数字人说话是正常的,替换为gpt-sovits后,数字人说话就会出现杂音。这应该怎么处理或者又没有解决问题的方向 @lipku

Proletariat-wh commented 1 week ago

修改ttsreal.py的170行,chunk_size参数调大一点有明显的好转,大佬,这边调整了其他地方是否需要同步调整?会有其他影响吗? first = True for chunk in res.iter_content(chunk_size=32000): # 1280 32K20ms2 if first: end = time.perf_counter() print(f"gpt_sovits Time to first chunk: {end-start}s") first = False if chunk and self.state==State.RUNNING: yield chunk

converxu commented 5 days ago

MuseTalk用CosyVoice也有滋滋声