Closed zouhan6806504 closed 3 years ago
您可以试试在 https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/paddlespeech/t2s/exps/fastspeech2/synthesize_e2e.py 115行设置 samplerate 为您需要的试试,目前用的是训练模型时设置的采样率
我试了一下,强行修改会改变音调,还是保存之后再修改吧, 在命令行 用 sox之类的修改或者保存之后 用 librosa 再 load 再保存哈
wav, _ = librosa.load('tmp.wav', sr=16000)
我试了一下,强行修改会改变音调,还是保存之后再修改吧, 在命令行 用 sox之类的修改或者保存之后 用 librosa 再 load 再保存哈
wav, _ = librosa.load('tmp.wav', sr=16000)
是的,我修改后得出的结果也是变调了 我用的是ffmpeg,能一次性改成功 ffmpeg -loglevel quiet -i {src} -ar 16000 {target}
或者生成后再找工具转码一次?