yeyupiaoling / PaddlePaddle-DeepSpeech

基于PaddlePaddle实现的语音识别,中文语音识别。项目完善,识别效果好。支持Windows,Linux下训练和预测,支持Nvidia Jetson开发板预测。
https://yeyupiaoling.blog.csdn.net/article/details/102904306
Apache License 2.0
650 stars 143 forks source link

使用博主提供的aishell模型测试自己的音频文件 #94

Closed cy5211 closed 2 years ago

cy5211 commented 2 years ago

首先非常感谢您的分享!咨询您一个问题: 我在测试自己的音频文件时发现准确率不是很高,因为我自己录制的音频通道数为2,所以使用了下述代码进行了预处理,请问还有其他需要做的工作吗?

# 改变音频采样率为16000Hz
def change_rate(audio_path):
    audio_path = audio_path.replace('\\', '/')
    data, sr = soundfile.read(audio_path)
    if sr != 16000:
        data, sr = librosa.load(audio_path, sr=16000)
        soundfile.write(audio_path, data, samplerate=16000)

望回复!谢谢!

yeyupiaoling commented 2 years ago

@cy5211 如果是使用自己的音频,准确率不高是正常的,因为数据集比较小,模型的泛化能力不够。