OpenGVLab / unmasked_teacher

[ICCV2023 Oral] Unmasked Teacher: Towards Training-Efficient Video Foundation Models
https://arxiv.org/abs/2303.16058
MIT License
285 stars 15 forks source link

关于下游任务 #39

Open MortironX opened 5 months ago

MortironX commented 5 months ago

博主你好,我从另一个项目到你推荐的UMT,手语识别任务,不知道用你们的模型是多模态好还是单模态,另外是用预训练还是零样本还是微调,还希望博主能够推荐一下。另外,我看了你们的详细步骤,好像创建完环境后只需要下载一个底模再修改data的路径和模型路径就可以是吧?

MortironX commented 5 months ago

另外,还想请教一下,如果要进行微调的话,是不是不需要完成预训练和零样本下面提示的步骤