yeyupiaoling / PaddlePaddle-DeepSpeech

基于PaddlePaddle实现的语音识别,中文语音识别。项目完善,识别效果好。支持Windows,Linux下训练和预测,支持Nvidia Jetson开发板预测。
https://yeyupiaoling.blog.csdn.net/article/details/102904306
Apache License 2.0
650 stars 143 forks source link

请教作者,针对一些专业名词,需要增加多少含有该名词语音的数据呢? #89

Closed shuiniu86 closed 2 years ago

shuiniu86 commented 2 years ago

因为用预训练模型,发现针对一些特定领域的专业名词的识别效果不好,想增加一些数据集进行训练,一个专业名词需要增加多少语音数据呢?

yeyupiaoling commented 2 years ago

你先试试三十个。因为目前提供的模型,训练的都是比较小的数据集