babysor / MockingBird

🚀AI拟声: 5秒内克隆您的声音并生成任意语音内容 Clone a voice in 5 seconds to generate arbitrary speech in real-time
Other
35.24k stars 5.21k forks source link

模型替换成Tacotron2时,推理出现问题 #797

Open Mahaotian1 opened 1 year ago

Mahaotian1 commented 1 year ago

当我输入一句带有逗号的句子,例如“欢迎使用工具箱,现已支持中文输入”时,我将句子处理成两个子句(与博主的处理方法一致),那么输入的batch就是2。但在Tacotron2里面,在判断gate门输出的时候,如果输入的句子batch为1时,就可以判断是否调出解码;但输入的句子batch为2时,就不能判断成功,我能将gate的阈值也变成batch为2的矩阵吗?

Mahaotian1 commented 1 year ago

a84e0a96f8d9fe3d05c2471ae030204

Mahaotian1 commented 1 year ago

700b6b16f631268244a528e6a1d753b 还是有别的处理方法呢