Open zangwill opened 5 months ago
是否可以先用ffmpeg提取视频的音频,根据音频检测人声所在的时间戳再进行截图
效果不好, 音频提取有https://github.com/YaoFANGUK/video-subtitle-generator, 你有更好的欢迎pr
融合想法很不错。但是音频检测错的时候,应该信音频的还是信OCR的。所以最好还是ASR和OCR分开搞。
是否可以先用ffmpeg提取视频的音频,根据音频检测人声所在的时间戳再进行截图