modelscope / FunASR

A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Recognition, Voice Activity Detection, Text Post-processing etc.
https://www.funasr.com
Other
6.18k stars 659 forks source link

采样率问题 #1980

Open dd123-a opened 2 months ago

dd123-a commented 2 months ago

❓ Questions and Help

采用speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx这个系列的模型,是不是只能实时读取转写16k采样率的音频,我尝试实时转写电脑内部的音频流时,在开始的json文件包含"audio_fs": 48000,响应结果没有任何变化,依然是错误的;有没有可以识别其他采样率的方法(我知道上传wav文件可以根据文件信息重新采样,二进制实时转写没看到相关的内容),针对二进制字节流,实时转写的解决方案。

dd123-a commented 2 months ago

image 不过这样处理也不管用