How was the pretraining dataset Laion-400M used ? does this actually refer to the use of the ‘open_clip_pytorch_model’ from OPENCLIP ?

ali-vilab / videocomposer

Official repo for VideoComposer: Compositional Video Synthesis with Motion Controllability

MIT License

907 stars 81 forks source link

您好，请教下，论文里提到的用Laion-400M预训练，是指用Laion-400M对VideoComposer做了额外的预训练？如果是的话，预训练的输入组织方式，和参与训练的算法模块，可以讲解一下吗？谢谢 ~

PS: 看代码里和Laion相关的有2个预训练模型，没有找到Laion-400M相关的，是不是我理解错了？

"v2-1_512-ema-pruned.ckpt" ：预训练是用Laion5B
“open_clip_pytorch_model” ：预训练是Laion2B （OPENCLIP里的“ViT-H-14", pretrained="laion2b_s32b_b79k”）

ali-vilab / videocomposer