ariesssxu / vta-ldm

Apache License 2.0
38 stars 2 forks source link

运行不起来 #1

Closed fallbernana123456 closed 1 week ago

fallbernana123456 commented 1 month ago

使用 sh inference_from_video.sh 后,里面的 --original_args="ariesssxu/$model/summary.jsonl" 的配置有问题。修改了 vae_model 改为 ariesssxu/vta-ldm-clip4clip-v-large/audioldm-s-full.ckpt fea_encoder_name 改为 openai/clip-vit-large-patch14 报错 Segmentation fault (core dumped)

ariesssxu commented 1 month ago

感谢提醒,已更新summary.jsonl,请git pull完后重试

fallbernana123456 commented 1 month ago

感谢提醒,已更新summary.jsonl,请git pull完后重试

可以运行了。但是没太明白生成的是什么?要求原始视频是英文的吗?生成的音频是对视频的理解?配乐?即使是样例也没太明白想做什么。

ariesssxu commented 2 weeks ago

主要做的是音效生成