dukGuo / valle-audiodec

Inference code for Audiodec-Valle-Wenetspeech4TTS
https://wenetspeech4tts.github.io/wenetspeech4tts/
Other
47 stars 2 forks source link

推理抛出异常 #5

Open kimqianyu2024 opened 4 months ago

kimqianyu2024 commented 4 months ago

您好, 在推理时,某些组合(提示音频+预测文字)会抛出异常。一种是 local variable 'res_wav' referenced before assignment,在 res_wav 前 加上 global 能够缓解;第二种是加了global之后还是报错,是 name 'res_wav' is not defined。 我的理解是不同长度的--text 要配合不同长度的prompt_wav,但问题出在哪一步。 能否解惑? 谢谢

dukGuo commented 4 months ago

推测应该是在从codec重建音频的过程中出错,可以提供测试样例吗? 有可能是前端G2P过程有问题导致VALLE预测出现问题,也有可能是VALLE本身对这个case预测效果差