采样频率 - Githubissues

Tele-AI / TeleSpeech-ASR

475 stars 39 forks source link

Open liugz18 opened 4 months ago

liugz18 commented 4 months ago

请问模型对音频采样频率有要求吗，比如16k还是8k

TTTdas commented 4 months ago

需要用16k音频测试，谢谢提醒！已更新在readme中

liugz18 commented 4 months ago

谢谢！还想请问如果16k模型用于处理8k上采样的音频是会效果不好吗，8k的电话录音，是不是一般需要8k专用的模型呢？

TTTdas commented 4 months ago

直接用16k的模型去识别8k音频效果会很差，一般来说8k专用的模型效果是最好的，不过将8k音频升采样到16k也可以进行识别。公布的结果中Babel就是8k的电话数据。您可以尝试利用工具将音频升采样到16k进行测试