yeyupiaoling / MASR

Pytorch实现的流式与非流式的自动语音识别框架,同时兼容在线和离线识别,目前支持Conformer、Squeezeformer、DeepSpeech2模型,支持多种数据增强方法。
Apache License 2.0
563 stars 100 forks source link

add pinyin_mode support #52

Closed tgarm closed 1 year ago

tgarm commented 1 year ago

pinyin_mode:

yeyupiaoling commented 1 year ago

感谢贡献,我得费点时间去处理

yeyupiaoling commented 1 year ago

@tgarm 转成拼音方式识别的优势是什么?

tgarm commented 1 year ago

目前是用来给用户做朗读评分,比较用户朗读的音频与预期拼音的差距,进行评分。

yeyupiaoling commented 1 year ago

@tgarm 这样的话,不太适合合并到本项目。本项目注意是做语音识别的,s2t