建议可以优化一下字幕截图提取方式

YaoFANGUK / video-subtitle-extractor

视频硬字幕提取，生成srt文件。无需申请第三方API，本地实现文本识别。基于深度学习的视频字幕提取框架，包含字幕区域检测、字幕内容提取。A GUI tool for extracting hard-coded subtitle (hardsub) from videos and generating srt files.

Apache License 2.0

6.2k stars 680 forks source link

建议可以优化一下字幕截图提取方式 #322

Open zangwill opened 5 months ago

zangwill commented 5 months ago

是否可以先用ffmpeg提取视频的音频，根据音频检测人声所在的时间戳再进行截图

eritpchy commented 5 months ago

效果不好, 音频提取有https://github.com/YaoFANGUK/video-subtitle-generator, 你有更好的欢迎pr

nhjydywd commented 3 months ago

融合想法很不错。但是音频检测错的时候，应该信音频的还是信OCR的。所以最好还是ASR和OCR分开搞。