Ayanaminn / N46Whisper

Whisper based Japanese subtitle generator
MIT License
1.54k stars 127 forks source link

推荐一个日文语音识别的工具,ReazonSpeech #99

Open fanglangxinghai opened 4 months ago

fanglangxinghai commented 4 months ago

可以用Whisper 的tiny模型的参数量,达到比Whisper的Large v2模型还准确。

PingZi-Wing commented 4 months ago

看了下介绍好像很牛,不过我用colab试了下没成功,崩溃了

PingZi-Wing commented 4 months ago

今天折腾了下,总算在colab上试用成功。结论不如fast whisper large v2。这玩意太耗内存了,25分钟的音频就把免费的12G内存爆了,20分钟的音频才成功,这时峰值占了10G内存。速度没有很快,20分钟转录了4分钟,而且好像有不识别前10s的毛病,准确度感觉不如large v2。