MrXnneHang / Auto_Caption_Generated_Offline

这是一个视频-音频-字幕的离线转换器,基于Funasr,支持wav-srt,mp4-srt。中文性能优于Whisper
35 stars 3 forks source link

mac 能用吗? #4

Closed cyclestudy closed 1 month ago

cyclestudy commented 2 months ago

具体怎么操作

MrXnneHang commented 2 months ago

mac我这边没有准备好一键包。

环境:

需要自己部署python环境,如果没有经验的话,可以看看miniconda或者anaconda mac是否支持以及基本的用法。
然后创建一个虚拟环境,
在pytorch官网找到mac安装torch的方法:https://pytorch.org/
这里我看官网是这样的,但这么安装只支持cpu推理。我也不清楚mac怎么cuda加速。

python -m pip install torch torchvision torchaudio

然后再安装funasr应该就可以

python -m pip install -U funasr

我再去导出一个requirements.txt。
你到时候安装完上面的后

python -m pip install -r  requirements.txt

应该环境上就ok了。

推理用的模型:

在modelscope上面下载我写在config.yml中的三个模型。
文件夹单独放在./models下面即可。

运行:

执行python run_srt.py就可以。
如果有再报其他错误可以找我 。

MrXnneHang commented 2 months ago

模型下载:https://github.com/MrXnneHang/Auto_Caption_Generated_Offline/blob/master/models/download.md

cyclestudy commented 1 month ago

mac我这边没有准备好一键包。

环境:

需要自己部署python环境,如果没有经验的话,可以看看miniconda或者anaconda mac是否支持以及基本的用法。 然后创建一个虚拟环境, 在pytorch官网找到mac安装torch的方法:https://pytorch.org/ 这里我看官网是这样的,但这么安装只支持cpu推理。我也不清楚mac怎么cuda加速。

python -m pip install torch torchvision torchaudio

然后再安装funasr应该就可以

python -m pip install -U funasr

我再去导出一个requirements.txt。 你到时候安装完上面的后

python -m pip install -r  requirements.txt

应该环境上就ok了。

推理用的模型:

在modelscope上面下载我写在config.yml中的三个模型。 文件夹单独放在./models下面即可。

运行:

执行python run_srt.py就可以。 如果有再报其他错误可以找我 。

始语音识别 You are using the latest version of funasr-1.1.0 0%| | 0/1 [00:02<?, ?it/s] Traceback (most recent call last): File "/Users/oo/soft/Auto_Caption_Generated_Offline/run_srt.py", line 62, in main(wav_name=file_names[i].split(".")[0]) File "/Users/oo/soft/Auto_Caption_Generated_Offline/run_srt.py", line 22, in main response = write_long_txt_with_timestamp(wav_name=wav_name, cut_line=cut_line, hot_word=hot_words) # ./tmp/.txt ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ File "/Users/oo/soft/Auto_Caption_Generated_Offline/time_stamp.py", line 11, in write_long_txt_with_timestamp model = Model.full_version() ^^^^^^^^^^^^^^^^^^^^ File "/Users/oo/soft/Auto_Caption_Generated_Offline/util.py", line 31, in full_version funasr_model = AutoModel( ^^^^^^^^^^ File "/opt/homebrew/lib/python3.11/site-packages/funasr/auto/auto_model.py", line 124, in init model, kwargs = self.build_model(kwargs) ^^^^^^^^^^^^^^^^^^^^^^^^^^ File "/opt/homebrew/lib/python3.11/site-packages/funasr/auto/auto_model.py", line 229, in build_model load_pretrained_model( File "/opt/homebrew/lib/python3.11/site-packages/funasr/train_utils/load_pretrained_model.py", line 38, in load_pretrained_model src_state = torch.load(path, map_location=map_location) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ File "/opt/homebrew/lib/python3.11/site-packages/torch/serialization.py", line 1040, in load return _legacy_load(opened_file, map_location, pickle_module, pickle_load_args) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ File "/opt/homebrew/lib/python3.11/site-packages/torch/serialization.py", line 1262, in _legacy_load magic_number = pickle_module.load(f, **pickle_load_args) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ _pickle.UnpicklingError: invalid load key, 'v'.

cyclestudy commented 1 month ago
image
MrXnneHang commented 1 month ago

检查一下.pt文件有没有下。git clone会clone不到。应该都是200MB左右的

MrXnneHang commented 1 month ago

以及./models下方的文件夹命名和config.yml中是否一致。

MrXnneHang commented 1 month ago

我找到的类似的issue,你可以尝试手动下载大文件:
https://discourse.aicrowd.com/t/solved-running-test-submission-py-runs-into-pickle-unpicklingerror-invalid-load-key-v/6458/2

Ok wow after 8 hours I fixed it <3
8 小时后,我修好了 <3

This is a problem with git lfs or so… I downloaded my checkpoints directly from the repository via my web-browser. Now it works :slight_smile:
这大概是 git lfs 的问题......我通过浏览器直接从版本库下载了检查点。现在可以了 :slight_smile:

It feel a bit crazy that I found this solution…
我找到了这个解决方案,感觉有点疯狂......

cyclestudy commented 1 month ago

算了 太麻烦 用一键吧 还有一件包能不能别用毒盘,