Closed wzr0108 closed 1 month ago
inference.py
source_audio = source_audio[:sr * 30] source_audio = torch.tensor(source_audio).unsqueeze(0).float().to(device) ref_audio = ref_audio[:(sr * 30 - source_audio.size(-1))]
sr * 30 - source_audio.size(-1)不是0吗,这里是否有问题
为什么说是0呢
torch==2.2.0+cu118,ref_audio会变成空
注释ref_audio = ref_audio[:(sr * 30 - source_audio.size(-1))]会对结果有影响吗
source超过30秒确实会0,不过inference.py没有考虑这么多情况,需要infer长音频请参考app.py中的方式
inference.py
sr * 30 - source_audio.size(-1)不是0吗,这里是否有问题