无法正确转换成文字

chenkui164 / FastASR

这是一个用C++实现ASR推理的项目，它依赖很少，安装也很简单，推理速度很快，在树莓派4B等ARM平台也可以流畅的运行。支持的模型是由Google的Transformer模型中优化而来，数据集是开源wenetspeech(10000+小时)或阿里私有数据集(60000+小时)，所以识别效果也很好，可以媲美许多商用的ASR软件。

Apache License 2.0

472 stars 72 forks source link

无法正确转换成文字 #76

Closed flyingdouers closed 4 months ago

flyingdouers commented 4 months ago

1、使用 k2_rnnt2_cli中的模型 2、语音是用麦克风直接录制的 3、本地运行 4、网盘是测试用的wav文件，谢谢！链接：https://pan.baidu.com/s/1f4RZRSs1u-atZAVtNDbmYw 提取码：s555

chenkui164 commented 4 months ago

你好，这个音频是双声道的，需要用工具转换成单声道，采样率16k是正确的。

flyingdouers commented 4 months ago

你好，非常感谢，已经可以识别了。我现在的字典库只需要50个汉字，bin模型能变的小点么？如果可以，我应该怎么做