buxuku / video-subtitle-master

批量为视频或者音频生成字幕,并可批量将字幕翻译成其它语言。这是一个客户端工具, 跨平台支持 mac 和 windows 系统, 支持百度,火山,deeplx, openai, deepseek, ollama 等多个翻译服务
MIT License
377 stars 20 forks source link

Whisper 容易出现 时间轴对不齐的问题,希望添加 sileo-vad 支持 #33

Open sullevy opened 1 month ago

sullevy commented 1 month ago

RT,whisper 转文字的时候,标点和时间有时候有点问题,需要通过 vad 先分割语音部分后,再转写。 也能减少 whsper 的幻觉,提高转写速度。

同时可以把 srt 翻译的功能,单独列做一个小功能。

buxuku commented 1 month ago

通过 silero-vad 确实能够解决一部分时间轴不准确的问题,但该项目是基于 nodejs 的开发的,目前我没找到好的方法来实现 VAD, 希望大家能够提供更多有帮助信息实现 vad 的支持。感谢🙏