yeyupiaoling / PaddlePaddle-DeepSpeech

基于PaddlePaddle实现的语音识别,中文语音识别。项目完善,识别效果好。支持Windows,Linux下训练和预测,支持Nvidia Jetson开发板预测。
https://yeyupiaoling.blog.csdn.net/article/details/102904306
Apache License 2.0
649 stars 143 forks source link

数据准备出错:无法将段规范化到 -20.000000 dB #134

Closed Desmond528 closed 2 years ago

Desmond528 commented 2 years ago

在执行python create_data.py时出错,到显示“开始抽取-1条数据计算均值和标准值”,并进行到255/1625的时候报错 报错信息: ERROR:root:DataLoader reader thread raised an exception!

ValueError: 无法将段规范化到 -20.000000 dB,因为可能的增益已经超过max_gain_db (300.000000 dB)

[Hint: Expected killed != true, but received killed:1 == true:1.] (at /paddle/paddle/fluid/operators/reader/blocking_queue.h:166) 求教这是啥问题

Desmond528 commented 2 years ago

依然不知道具体问题是什么,不过发现是某些wav会造成这个异常,就写了个脚本把数据集切分若干次找出了有问题的wav然后扔掉了

Wei-JL commented 6 months ago

请问这个问题是什么原因,我这边是用录音设备录制的? 也是同样的报错

Desmond528 commented 5 months ago

我没去找问题的原因,就只是把那些有问题的录音文件给丢掉了