Open tesfayetong opened 4 months ago
为啥speech_to_sil_time_thres设置的越大,切割出的音频会越多呢?
这个参数的意思是声音到静音的最长时间阈值么?为什么我设置的越小,反而切分出的结果也越少了呢,照理说阈值减小了应该越多?
❓ Questions and Help
为啥speech_to_sil_time_thres设置的越大,切割出的音频会越多呢?