yeyupiaoling / PaddlePaddle-DeepSpeech

基于PaddlePaddle实现的语音识别,中文语音识别。项目完善,识别效果好。支持Windows,Linux下训练和预测,支持Nvidia Jetson开发板预测。
https://yeyupiaoling.blog.csdn.net/article/details/102904306
Apache License 2.0
667 stars 145 forks source link

关于合成语音数据集 #114

Closed uloveqian2021 closed 2 years ago

uloveqian2021 commented 2 years ago

“tools/generate_audio/speaker_audio目录下,开发者也可以尝试入自己的音频放入该目录,这样训练出来的模型能更好识别开发者的语音,采样率最好是16000Hz” 大佬,您好,请问要怎么合成自己声音的数据集,我看当前的 generate_audio.py 代码中没有用到speaker_audio目录下的音频,希望能指导一下,谢谢!

yeyupiaoling commented 2 years ago

这个不支持声音克隆,只能通过这种方式设置说话人。 https://github.com/yeyupiaoling/PaddlePaddle-DeepSpeech/blob/eb518cd14a0288b7d2b5a457cb4ff3ae4a9a6e59/tools/generate_audio/generate_audio.py#L88