直接录制语音和上传语音文件，识别效果的差异

yeyupiaoling / MASR

Pytorch实现的流式与非流式的自动语音识别框架，同时兼容在线和离线识别，目前支持Conformer、Squeezeformer、DeepSpeech2模型，支持多种数据增强方法。

Apache License 2.0

563 stars 100 forks source link

Closed bird7code closed 2 years ago

bird7code commented 2 years ago

你好，在Web部署模型中，使用相同的话语，直接录制语音的识别效果和上传语音文件的识别效果差异比较大（上传语音文件的更好），想学习一下这是什么原因

yeyupiaoling commented 2 years ago

直接录制语音的识别效果会差吗？

bird7code commented 2 years ago

直接录制语音的识别效果会差吗？基本都识别不出来的那种，和录音设备有关吗

yeyupiaoling commented 2 years ago

你听听直接录音的音频播放是怎样的

bird7code commented 2 years ago

你听听直接录音的音频播放是怎样的听了一下，语音中的字是对的，但是语速很慢，不是原声。只有一点字才识别出来

yeyupiaoling commented 2 years ago

那可能是录音有问题

bird7code commented 2 years ago

那可能是录音有问题好的谢谢，我检查一下这方面问题