modelscope / FunASR

A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Recognition, Voice Activity Detection, Text Post-processing etc.
https://www.funasr.com
Other
5.99k stars 647 forks source link

docker cpu0.45时间戳bug #2091

Open cuiyuanzhe opened 15 hours ago

cuiyuanzhe commented 15 hours ago

使用的cpu离线识别的镜像 使用文档默认配置 在说完一句话停顿几秒钟时,会将停顿的时间计算入说话的时间戳里。 image 实际上每一句话之间都有停顿5~15秒,但是时间戳是连续的 可以看到一个字的时间跨度有1秒以上

cuiyuanzhe commented 14 hours ago

图片的第一列是返回结果中的开始时间戳,第二列是结束时间戳