Open murphypei opened 2 years ago
https://murphypei.github.io/blog/2021/10/asr-fbank-mfcc.html
ASR 流程中,音频特征提取是第一步。和 CV 不同,图片本身的 RGB 数值就是一种特征,但是音频本身无法被用于分析,常常是将一段音频提取 FBank 和 MFCC 特征然后作为模型的输入。
https://murphypei.github.io/blog/2021/10/asr-fbank-mfcc.html
ASR 流程中,音频特征提取是第一步。和 CV 不同,图片本身的 RGB 数值就是一种特征,但是音频本身无法被用于分析,常常是将一段音频提取 FBank 和 MFCC 特征然后作为模型的输入。