数据准备出错：无法将段规范化到 -20.000000 dB

yeyupiaoling / PaddlePaddle-DeepSpeech

基于PaddlePaddle实现的语音识别，中文语音识别。项目完善，识别效果好。支持Windows，Linux下训练和预测，支持Nvidia Jetson开发板预测。

Apache License 2.0

649 stars 143 forks source link

Closed Desmond528 closed 2 years ago

Desmond528 commented 2 years ago

在执行python create_data.py时出错，到显示“开始抽取-1条数据计算均值和标准值”，并进行到255/1625的时候报错报错信息： ERROR:root:DataLoader reader thread raised an exception!

ValueError: 无法将段规范化到 -20.000000 dB，因为可能的增益已经超过max_gain_db (300.000000 dB)

[Hint: Expected killed != true, but received killed:1 == true:1.] (at /paddle/paddle/fluid/operators/reader/blocking_queue.h:166) 求教这是啥问题

Desmond528 commented 2 years ago

依然不知道具体问题是什么，不过发现是某些wav会造成这个异常，就写了个脚本把数据集切分若干次找出了有问题的wav然后扔掉了

Wei-JL commented 6 months ago

请问这个问题是什么原因，我这边是用录音设备录制的？也是同样的报错

Desmond528 commented 5 months ago

我没去找问题的原因，就只是把那些有问题的录音文件给丢掉了