chenkui164 / FastASR

这是一个用C++实现ASR推理的项目,它依赖很少,安装也很简单,推理速度很快,在树莓派4B等ARM平台也可以流畅的运行。 支持的模型是由Google的Transformer模型中优化而来,数据集是开源wenetspeech(10000+小时)或阿里私有数据集(60000+小时), 所以识别效果也很好,可以媲美许多商用的ASR软件。
Apache License 2.0
481 stars 74 forks source link

[feature request] 楼主可以画一个拆分的结构图吗? #6

Closed lucasjinreal closed 2 years ago

lucasjinreal commented 2 years ago

原版的确比较复杂,尤其是到出道onnx之后,很多浇水算子,也没有了最原始的结构信息。

楼主是否可以考虑画一个 FastASR里面的结构图,例如讲那些模块合并了,做了哪些拆分。最好是能匹配上原版python对应的部分

chenkui164 commented 2 years ago

conformer模型结构可以参考论文 ,我并没有进行模块合并与拆分,基本只是复现了一下论文中的推理过程而已。