yeyupiaoling / MASR

Pytorch实现的流式与非流式的自动语音识别框架,同时兼容在线和离线识别,目前支持Conformer、Squeezeformer、DeepSpeech2模型,支持多种数据增强方法。
Apache License 2.0
597 stars 106 forks source link

训练模型问题 #14

Closed zhaojunliing closed 3 years ago

zhaojunliing commented 3 years ago

你好,能在百度的模型基础上,添加自己特定的语音进行训练吗

yeyupiaoling commented 3 years ago

@zhaojunliing 你说的百度的模型是指那个?是指这个吗:https://github.com/yeyupiaoling/PaddlePaddle-DeepSpeech 这个是不行的,如果要训练,就要使用这个模型来训练。

zhaojunliing commented 3 years ago

下载的lm那个 对了,还有一个问题,这边在docker中安装,ctcdecode安装成功了,warp-ctc一直编译识别。 有现成的docker运行镜像吗?

yeyupiaoling commented 3 years ago

@zhaojunliing 没有哦,lm是语言模型,这个哪里都可以用。warp-ctc编写是要点时间的。

zhaojunliing commented 3 years ago

好的,那我再试一试