Tele-AI / TeleSpeech-ASR

475 stars 39 forks source link

采样频率 #17

Open liugz18 opened 4 months ago

liugz18 commented 4 months ago

请问模型对音频采样频率有要求吗,比如16k还是8k

TTTdas commented 4 months ago

需要用16k音频测试,谢谢提醒!已更新在readme中

liugz18 commented 4 months ago

谢谢!还想请问如果16k模型用于处理8k上采样的音频是会效果不好吗,8k的电话录音,是不是一般需要8k专用的模型呢?

TTTdas commented 4 months ago

直接用16k的模型去识别8k音频效果会很差,一般来说8k专用的模型效果是最好的,不过将8k音频升采样到16k也可以进行识别。公布的结果中Babel就是8k的电话数据。您可以尝试利用工具将音频升采样到16k进行测试