chenkui164 / FastASR

这是一个用C++实现ASR推理的项目,它依赖很少,安装也很简单,推理速度很快,在树莓派4B等ARM平台也可以流畅的运行。 支持的模型是由Google的Transformer模型中优化而来,数据集是开源wenetspeech(10000+小时)或阿里私有数据集(60000+小时), 所以识别效果也很好,可以媲美许多商用的ASR软件。
Apache License 2.0
481 stars 74 forks source link

zsh: segmentation fault #8

Closed jkluo closed 2 years ago

jkluo commented 2 years ago

./build/examples/fastasr_cli_c cli/ ~/Downloads/20220308.wav
Audio time is 254.849060 s. Model initialization takes 0.346016s zsh: segmentation fault ./build/examples/fastasr_cli_c cli/ ~/Downloads/20220308.wav

jkluo commented 2 years ago

请问是不是音频时间问题呢? 测试的音频是跑起来了

chenkui164 commented 2 years ago

对输入的音频是有要求的,必须是wav格式,并且采样率为16000,长度能超过50s @jkluo

jkluo commented 2 years ago

对输入的音频是有要求的,必须是wav格式,并且采样率为16000,长度能超过50s @jkluo

@chenkui164 如果我音频长度超过50s,除了将长音频分割成多个 小于50s的短音频外,还有其他方法吗?修改源码的音频长度限制可以吗?

chenkui164 commented 2 years ago

@jkluo 这是不可行的,要通过算法将长的音频分割为每句话。这是由conformer模型本身的特点决定的。

jkluo commented 2 years ago

@jkluo 这是不可行的,要通过算法将长的音频分割为每句话。这是由conformer模型本身的特点决定的。

好的,感谢作者解答。 另外我看项目中有提到 本项目最终生成的是动态库libfastasr.so和静态库libfastasr.a文件,方便用户的调用 , 我在目录下没有找到 这两个问题,请教一下这两个文件要怎么使用呢?

chenkui164 commented 2 years ago

在目录XXX/FastASR/build/lib里面,有静态库libfastasr.a,我试了下动态库好像没有生成,需要改一下cmakefile了。

这是一个C和C++的库,程序示例可以参考XXX/FastASR/examples/中,使用方法很简单。 @jkluo

chenkui164 commented 1 year ago

可以试试,最新版的fastasr,已经支持长语音了。 @jkluo