tangly1024 / Video2Text

视频转文字
71 stars 34 forks source link

实际上、运行完程序后没有txt文本里没有任何东西。然后程序也没有报错 #6

Open youzeliang opened 1 year ago

youzeliang commented 1 year ago

image

image

liuchangzong commented 10 months ago

你好,@youzeliang , 程序报错的原因是有些音频无法转换,这可能是speech_recognition模组的问题,至少我没有发现该代码仓中在此方面有其他问题。合并后的txt文件没有东西是因为:在有些音频无法转换为txt的情况下,这些txt文件就不存在了(没有创建),所以无法将其合并。 解决方法:将file_utils.py文件中的combine_text函数的:

if os.path.exists(text_file):
      with open(text_file) as f:
          k.write(f.read() + "\r\n")
else:
    break

中的break换成continue。 这样程序就会跳过不存在的txt文件,只合并存在的。 另外你还可以更改convert_by_google函数,为转化失败的音频文件创建空txt文件,亦可。

又: 我最近在做视频台词提取,暂时没有找到好的语音转文字api,想问问大家是否有好的推荐,谢谢。 针对目前代码仓中的处理来说,恰如作者所言,切分30秒来提取台词语义的效果并不好,想请教大家是否有做图片字幕识别的项目(如使用ocr, opencv)可供学习推荐,感谢。