yeyupiaoling / PaddlePaddle-DeepSpeech

基于PaddlePaddle实现的语音识别,中文语音识别。项目完善,识别效果好。支持Windows,Linux下训练和预测,支持Nvidia Jetson开发板预测。
https://yeyupiaoling.blog.csdn.net/article/details/102904306
Apache License 2.0
650 stars 143 forks source link

可不可以在预训练模型基础下,训练新的数据集? #86

Closed sutyd closed 2 years ago

sutyd commented 2 years ago

还是只能把新的数据集加进去,重新create__data再训练?

yeyupiaoling commented 2 years ago

可以使用预训练,并把新的数据集加进去原来的数据集中一起训练,不要替换原来的均值文件和词汇表文件。训练几个epoch应该就能拟合新添加的数据了