Open sullevy opened 2 months ago
RT,whisper 转文字的时候,标点和时间有时候有点问题,需要通过 vad 先分割语音部分后,再转写。 也能减少 whsper 的幻觉,提高转写速度。
同时可以把 srt 翻译的功能,单独列做一个小功能。
通过 silero-vad 确实能够解决一部分时间轴不准确的问题,但该项目是基于 nodejs 的开发的,目前我没找到好的方法来实现 VAD, 希望大家能够提供更多有帮助信息实现 vad 的支持。感谢🙏
RT,whisper 转文字的时候,标点和时间有时候有点问题,需要通过 vad 先分割语音部分后,再转写。 也能减少 whsper 的幻觉,提高转写速度。
同时可以把 srt 翻译的功能,单独列做一个小功能。