chenkui164 / FastASR

这是一个用C++实现ASR推理的项目,它依赖很少,安装也很简单,推理速度很快,在树莓派4B等ARM平台也可以流畅的运行。 支持的模型是由Google的Transformer模型中优化而来,数据集是开源wenetspeech(10000+小时)或阿里私有数据集(60000+小时), 所以识别效果也很好,可以媲美许多商用的ASR软件。
Apache License 2.0
472 stars 72 forks source link

达摩院2023-10推出了包含说话人分离和标点符号的模型(python),大佬有兴趣整合一个C++版的吗? #72

Open Tony-xubiao opened 7 months ago

Tony-xubiao commented 7 months ago

既有标点,又分离多说话人,可惜只有python的,rtf只有0.5,您的c++方案rtf接近0.1了 https://www.modelscope.cn/models/damo/speech_paraformer-large-vad-punc-spk_asr_nat-zh-cn/summary