yeyupiaoling / PPASR

基于PaddlePaddle实现端到端中文语音识别,从入门到实战,超简单的入门案例,超实用的企业项目。支持当前最流行的DeepSpeech2、Conformer、Squeezeformer模型
Apache License 2.0
797 stars 131 forks source link

大佬使用deepspeech2_big预测只要改图中这里就行吗,报了这个错 #106

Closed ZengLei-dev closed 1 year ago

ZengLei-dev commented 1 year ago

1660497502(1)

1660497592(1) 1660497603(1)

yeyupiaoling commented 1 year ago

image

yeyupiaoling commented 1 year ago

这样路径也要指定

ZengLei-dev commented 1 year ago

大佬,都改了还是执行不了诶,模型下的目录结构也是deepspeech2_big的 image 1660538076(1) 看这报错是不是得改模型代码呢

ZengLei-dev commented 1 year ago

debug调试时发现到self.predictor.run()就崩溃了 1660538331(1)

yeyupiaoling commented 1 year ago

你看看你下载的和你指定的模型是否一致

ZengLei-dev commented 1 year ago

是一致的,我把参数改成deepspeech2,用这个就能预测 1660544132(1)

yeyupiaoling commented 1 year ago

你用的是最新代码吗?下载的那几个模型?

ZengLei-dev commented 1 year ago

是的最新的,用过thchs30,aishell,librispeech测过都可以,只是这个大数据集的不行

yeyupiaoling commented 1 year ago

你看看你的代码有没有这个 https://github.com/yeyupiaoling/PPASR/blob/7e756d8f5a7eca7cbeebc5673c033625add8261f/ppasr/predict.py#L72-L75

ZengLei-dev commented 1 year ago

我去,确实没有,感谢大佬

yeyupiaoling commented 1 year ago

那就是旧代码,

ZengLei-dev commented 1 year ago

明白了,看来我记错了,请问用这个大数据模型预测自己录的音频效果怎么样呢

yeyupiaoling commented 1 year ago

这些准确率都是基于现有的数据集的,识别效果还得自己测试。 要使用集束搜索解码器。

ZengLei-dev commented 1 year ago

好的,谢谢您了