yeyupiaoling / PaddlePaddle-DeepSpeech

基于PaddlePaddle实现的语音识别,中文语音识别。项目完善,识别效果好。支持Windows,Linux下训练和预测,支持Nvidia Jetson开发板预测。
https://yeyupiaoling.blog.csdn.net/article/details/102904306
Apache License 2.0
667 stars 145 forks source link

数据格式 #87

Closed yuanweihong closed 2 years ago

yuanweihong commented 3 years ago

dataset/audio/wav/0975/T0055G0002S0050.wav 您好 请问 您 是 有 房子 出租 吗

请问annotation中如上的数据格式对训练有影响吗?汉字中间是不是不能有空格?麻烦解答下,多谢!

yeyupiaoling commented 3 years ago

在生数据列表的时候 自动去掉空格的