大视频好像有问题

chenkui164 / FastASR

这是一个用C++实现ASR推理的项目，它依赖很少，安装也很简单，推理速度很快，在树莓派4B等ARM平台也可以流畅的运行。支持的模型是由Google的Transformer模型中优化而来，数据集是开源wenetspeech(10000+小时)或阿里私有数据集(60000+小时)，所以识别效果也很好，可以媲美许多商用的ASR软件。

Apache License 2.0

481 stars 74 forks source link

大视频好像有问题 #25

Closed 591440833 closed 1 year ago

591440833 commented 1 year ago

链接：https://pan.baidu.com/s/13NM3UtRd1IBhQT13btdDBg 提取码：f7as

chenkui164 commented 1 year ago

你提供的这段音频文件是双声道，采样率是44100Hz所以不能直接使用，需要转换成16000Hz单声道的音频文件。可以找工具转换一下。比如： ffmpeg -i 相声.wav -acodec pcm_s16le -ar 16000 -ac 1 sample.wav