Closed yzslry closed 3 months ago
使用长度为9.42s的音频实际测试,encoder的推理时间就需要0.5s左右,开源的模型是报告中10s音频推理仅需70ms的模型吗?
Please upload you wav and logfile.
别用,效果奇差。和whisper差远了。
使用长度为9.42s的音频实际测试,encoder的推理时间就需要0.5s左右,开源的模型是报告中10s音频推理仅需70ms的模型吗?