Chenyme / Chenyme-AAVT

这是一个全自动(音频)视频翻译项目。利用Whisper识别声音,AI大模型翻译字幕,最后合并字幕视频,生成翻译后的视频。
MIT License
1.52k stars 135 forks source link

【错误】视频识别的错误 #56

Open porlock27 opened 1 month ago

porlock27 commented 1 month ago

操作系统

Windows 10 专业版 19045.4780

项目版本

CUDA v12.4

Python版本

Python 3.12.4

错误描述

Snipaste_2024-08-28_01-45-48 Snipaste_2024-08-28_01-47-00 Snipaste_2024-08-28_01-52-24

使用视频识别时出错。配置为i5-11400H,16G DDR4 3200 ,3060Laptop。

重现步骤

1.下载AAVT0.9.0_Win.zip解压。选择12.4版本出错后,下载CUDA_dll.zip 压缩包解压。
2.【Whisper 后端】设置为【FasterWhisper - AutoDownload】,启用GPU加速、VAD辅助。
3.配置DeepSeek 深度求索,接口测试通过。
4.【Whisper 识别参数】选择【large-v3】,语言选择自动。
5.下载视频【https://www.bilibili.com/video/BV1nwpreAErw/】进行测试。视频格式为h.264,名称改为1.mp4。
6.在【AI 全自动视频翻译】界面点击文件上传,文件拖动进去,,点击【开始识别】。报错:[❌ ERROR] 运行出错!

错误截图

Local URL: http://localhost:8501
  Network URL: http://192.168.31.226:8501

E:\SoftWare\AAVT0.9.0_Win\page\project\home.py:129: SyntaxWarning: invalid escape sequence '\C'
  content = """

==================================================

*** Chenyme-AAVT AI音频识别 ***

🚀 任务开始执行
📂 本次任务目录: E:\SoftWare\AAVT0.9.0_Win/cache/video/1_20240828013837
⚠️ 请不要在任务运行期间切换菜单或修改参数!
🎧 文件已成功转换为 MP3 格式!

*** Faster Whisper 自动下载模式 ***

🖥️ 运行模型: large-v3
⚙️️ 运行方式: cuda
🎙️ VAD辅助: True
config.json: 100%|████████████████████████████████████████████████████████████████████████| 2.39k/2.39k [00:00<?, ?B/s]
E:\SoftWare\AAVT0.9.0_Win\env\Lib\site-packages\huggingface_hub\file_download.py:159: UserWarning: `huggingface_hub` cache-system uses symlinks by default to efficiently store duplicated files but your machine does not support them in C:\Users\xuezh\.cache\huggingface\hub\models--Systran--faster-whisper-large-v3. Caching files will still work but in a degraded version that might require more space on your disk. This warning can be disabled by setting the `HF_HUB_DISABLE_SYMLINKS_WARNING` environment variable. For more details, see https://huggingface.co/docs/huggingface_hub/how-to-cache#limitations.
To support symlinks on Windows, you either need to activate Developer Mode or to run Python as an administrator. In order to see activate developer mode, see this article: https://docs.microsoft.com/en-us/windows/apps/get-started/enable-your-device-for-development
  warnings.warn(message)
preprocessor_config.json: 100%|███████████████████████████████████████████████████████████████| 340/340 [00:00<?, ?B/s]
tokenizer.json: 100%|█████████████████████████████████████████████████████████████| 2.48M/2.48M [00:00<00:00, 5.47MB/s]
vocabulary.json: 100%|████████████████████████████████████████████████████████████| 1.07M/1.07M [00:00<00:00, 1.88MB/s]
model.bin: 100%|██████████████████████████████████████████████████████████████████| 3.09G/3.09G [05:01<00:00, 10.2MB/s]
📝 Whisper识别结果:
本日24時35分からYouTubeプレミア公開でアイドルズ美しきインフェルノの第4話が公開されます。 東海テレビ富士テレビ系毎週の夜23時40分から放送される笑う宿所内で60秒少女クテレビCMが放送されます。ぜひ見てください。 本日24時35分からYouTubeプレ ミア公開でアイドルズ美しきインフェルノの第4話が公開されます。 東海テレビフジテレビ系毎週土曜23時40分から放送される 笑う祝助内で60秒超弱テレビCMが放送されます ぜひ見てください

[❌ ERROR] 运行出错!

"若显示 缺失 fbgemm.dll,请使用Install选择修复版本!"
"若显示 缺失 cudnn_ops_infer64_8.dll 请前往GitHub下载相关dll!"
"若有其他报错,请阅读常见问题,或前往GitHub 或 群组讨论!"

Press any key to continue . . .

其他信息(可选)

No response

Chenyme commented 1 month ago

你好,我可能已经找到问题所在,能否使用您的环境测试一下是否?如果可以希望可以提供一下联系方式,非常感谢~

TheBug233 commented 1 month ago

你好,我可能已经找到问题所在,能否使用您的环境测试一下是否?如果可以希望可以提供一下联系方式,非常感谢~

我这边遇到了同样的问题,在输出识别结果后出现同样没有报错的“运行出错”...需要提供联系方式吗?

Chenyme commented 4 weeks ago

@TheBug233 @porlock27


感谢您的的反馈,这个堆栈错误其实是由于faster-whisper原生库导致,之前是用启动新进程来规避,但目前streamlit新版本直接启动新进程会失败。暂时无法修复,我正在寻找解决办法! 您目前可以尝试设置faster-whisper后端的temperature为0来规避此错误。我会尽快找出解决办法并修复!