yeyupiaoling / PaddlePaddle-DeepSpeech

基于PaddlePaddle实现的语音识别,中文语音识别。项目完善,识别效果好。支持Windows,Linux下训练和预测,支持Nvidia Jetson开发板预测。
https://yeyupiaoling.blog.csdn.net/article/details/102904306
Apache License 2.0
681 stars 145 forks source link

如果测试音频有背景音乐等噪音,效果好像变差了很多,有办法解决吗 #35

Closed yxy-lol closed 3 years ago

yxy-lol commented 3 years ago

代码内有类似人声提取等预处理方法吗,或者有类似方法推荐吗,谢谢

yeyupiaoling commented 3 years ago

这是只是将音频执行短时傅里叶换,你说的人声提取,这个我不了解。

yeyupiaoling commented 3 years ago

@yxy-lol 你说的有噪音,这个也没问题的,识别识别变差是因为数据集不够。如何是只是想降噪,可以试试下面的方法:

from aukit import remove_noise

wav, sr_ret = librosa.load(audio_path, sr=16000)
wav = remove_noise(wav, sr_ret )