chenkui164 / FastASR

这是一个用C++实现ASR推理的项目,它依赖很少,安装也很简单,推理速度很快,在树莓派4B等ARM平台也可以流畅的运行。 支持的模型是由Google的Transformer模型中优化而来,数据集是开源wenetspeech(10000+小时)或阿里私有数据集(60000+小时), 所以识别效果也很好,可以媲美许多商用的ASR软件。
Apache License 2.0
481 stars 74 forks source link

大视频好像有问题 #25

Closed 591440833 closed 1 year ago

591440833 commented 1 year ago

链接:https://pan.baidu.com/s/13NM3UtRd1IBhQT13btdDBg 提取码:f7as

chenkui164 commented 1 year ago

你提供的这段音频文件是双声道,采样率是44100Hz所以不能直接使用,需要转换成16000Hz单声道的音频文件。 可以找工具转换一下。 比如: ffmpeg -i 相声.wav -acodec pcm_s16le -ar 16000 -ac 1 sample.wav