yeyupiaoling / MASR

Pytorch实现的流式与非流式的自动语音识别框架,同时兼容在线和离线识别,目前支持Conformer、Squeezeformer、DeepSpeech2模型,支持多种数据增强方法。
Apache License 2.0
563 stars 100 forks source link

直接录制语音和上传语音文件,识别效果的差异 #36

Closed bird7code closed 2 years ago

bird7code commented 2 years ago

你好,在Web部署模型中,使用相同的话语,直接录制语音的识别效果和上传语音文件的识别效果差异比较大(上传语音文件的更好),想学习一下这是什么原因

yeyupiaoling commented 2 years ago

直接录制语音的识别效果会差吗?

bird7code commented 2 years ago

直接录制语音的识别效果会差吗? 基本都识别不出来的那种,和录音设备有关吗

yeyupiaoling commented 2 years ago

你听听直接录音的音频播放是怎样的

bird7code commented 2 years ago

你听听直接录音的音频播放是怎样的 听了一下,语音中的字是对的,但是语速很慢,不是原声。只有一点字才识别出来

yeyupiaoling commented 2 years ago

那可能是录音有问题

bird7code commented 2 years ago

那可能是录音有问题 好的谢谢,我检查一下这方面问题