yeyupiaoling / PPASR

基于PaddlePaddle实现端到端中文语音识别,从入门到实战,超简单的入门案例,超实用的企业项目。支持当前最流行的DeepSpeech2、Conformer、Squeezeformer模型
Apache License 2.0
797 stars 131 forks source link

python train.py的时候报错 #158

Closed 2954456878 closed 1 year ago

2954456878 commented 1 year ago

create_data.py已经执行完毕,也已经生成了 3JIVME0G62 $30 Q2NGXBTJ ,执行train.py时报错 LDBXXP40PKZ 3~E6 J0VC{M

yeyupiaoling commented 1 year ago

很明显你数据列表没有数据啊。你看一下你是不是生成的时候有失败或者哪里写错了?

2954456878 commented 1 year ago

很明显你数据列表没有数据啊。你看一下你是不是生成的时候有失败或者哪里写错了?

image 数据列表 都是正常生成的呀,也有url和text,音频文件也对的上

yeyupiaoling commented 1 year ago

你是不是存放错误路径了,你看一下。或者你手动打印看一下。

2954456878 commented 1 year ago

已解决,是音频长度的问题,超过了初始设置的max_duration:20