murphypei / murphypei.github.io

15 stars 6 forks source link

语音识别 FBank 和 MFCC 特征 | 拾荒志 #75

Open murphypei opened 2 years ago

murphypei commented 2 years ago

https://murphypei.github.io/blog/2021/10/asr-fbank-mfcc.html

ASR 流程中,音频特征提取是第一步。和 CV 不同,图片本身的 RGB 数值就是一种特征,但是音频本身无法被用于分析,常常是将一段音频提取 FBank 和 MFCC 特征然后作为模型的输入。