如果测试音频有背景音乐等噪音，效果好像变差了很多，有办法解决吗

yeyupiaoling / PaddlePaddle-DeepSpeech

基于PaddlePaddle实现的语音识别，中文语音识别。项目完善，识别效果好。支持Windows，Linux下训练和预测，支持Nvidia Jetson开发板预测。

Apache License 2.0

681 stars 145 forks source link

Closed yxy-lol closed 3 years ago

yxy-lol commented 3 years ago

代码内有类似人声提取等预处理方法吗，或者有类似方法推荐吗，谢谢

yeyupiaoling commented 3 years ago

这是只是将音频执行短时傅里叶换，你说的人声提取，这个我不了解。

yeyupiaoling commented 3 years ago

@yxy-lol 你说的有噪音，这个也没问题的，识别识别变差是因为数据集不够。如何是只是想降噪，可以试试下面的方法：

from aukit import remove_noise

wav, sr_ret = librosa.load(audio_path, sr=16000)
wav = remove_noise(wav, sr_ret )