python scripts/zero_shot.py

Why does this error occur? How do I solve this?

$ python zero_shot.py /home/cr/miniconda3/envs/backdoor_Medclip/lib/python3.8/site-packages/torchvision/models/_utils.py:208: UserWarning: The parameter 'pretrained' is deprecated since 0.13 and may be removed in the future, please use 'weights' instead. warnings.warn( /home/cr/miniconda3/envs/backdoor_Medclip/lib/python3.8/site-packages/torchvision/models/_utils.py:223: UserWarning: Arguments other than a weight enum or None for 'weights' are deprecated since 0.13 and may be removed in the future. The current behavior is equivalent to passing weights=ResNet50_Weights.IMAGENET1K_V1. You can also use weights=ResNet50_Weights.DEFAULT to get the most up-to-date weights. warnings.warn(msg) Some weights of the model checkpoint at emilyalsentzer/Bio_ClinicalBERT were not used when initializing BertModel: ['cls.predictions.transform.LayerNorm.bias', 'cls.predictions.transform.dense.bias', 'cls.predictions.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.dense.weight', 'cls.predictions.decoder.weight', 'cls.seq_relationship.bias', 'cls.seq_relationship.weight']

This IS expected if you are initializing BertModel from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
This IS NOT expected if you are initializing BertModel from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model). Traceback (most recent call last): File "zero_shot.py", line 159, in evaluation1 = MainEvaluator(use_vit=True, File "zero_shot.py", line 128, in init self.model = self.model_builder.build_model(checkpoint=checkpoint) File "zero_shot.py", line 48, in build_model model = MedCLIPModel(vision_cls=vision_cls, checkpoint=checkpoint) File "/home/cr/miniconda3/envs/backdoor_Medclip/lib/python3.8/site-packages/medclip/modeling_medclip.py", line 148, in init self.load_state_dict(state_dict) File "/home/cr/miniconda3/envs/backdoor_Medclip/lib/python3.8/site-packages/torch/nn/modules/module.py", line 2041, in load_state_dict raise RuntimeError('Error(s) in loading state_dict for {}:\n\t{}'.format( RuntimeError: Error(s) in loading state_dict for MedCLIPModel: Missing key(s) in state_dict: "vision_model.model.conv1.weight", "vision_model.model.bn1.weight", "vision_model.model.bn1.bias", "vision_model.model.bn1.running_mean", "vision_model.model.bn1.running_var", "vision_model.model.layer1.0.conv1.weight", "vision_model.model.layer1.0.bn1.weight", "vision_model.model.layer1.0.bn1.bias", "vision_model.model.layer1.0.bn1.running_mean", "vision_model.model.layer1.0.bn1.running_var", "vision_model.model.layer1.0.conv2.weight", "vision_model.model.layer1.0.bn2.weight", "vision_model.model.layer1.0.bn2.bias", "vision_model.model.layer1.0.bn2.running_mean", "vision_model.model.layer1.0.bn2.running_var", "vision_model.model.layer1.0.conv3.weight", "vision_model.model.layer1.0.bn3.weight", "vision_model.model.layer1.0.bn3.bias", "vision_model.model.layer1.0.bn3.running_mean", "vision_model.model.layer1.0.bn3.running_var", "vision_model.model.layer1.0.downsample.0.weight", "vision_model.model.layer1.0.downsample.1.weight", "vision_model.model.layer1.0.downsample.1.bias", "vision_model.model.layer1.0.downsample.1.running_mean", "vision_model.model.layer1.0.downsample.1.running_var", "vision_model.model.layer1.1.conv1.weight", "vision_model.model.layer1.1.bn1.weight", "vision_model.model.layer1.1.bn1.bias", "vision_model.model.layer1.1.bn1.running_mean", "vision_model.model.layer1.1.bn1.running_var", "vision_model.model.layer1.1.conv2.weight", "vision_model.model.layer1.1.bn2.weight", "vision_model.model.layer1.1.bn2.bias", "vision_model.model.layer1.1.bn2.running_mean", "vision_model.model.layer1.1.bn2.running_var", "vision_model.model.layer1.1.conv3.weight", "vision_model.model.layer1.1.bn3.weight", "vision_model.model.layer1.1.bn3.bias", "vision_model.model.layer1.1.bn3.running_mean", "vision_model.model.layer1.1.bn3.running_var", "vision_model.model.layer1.2.conv1.weight", "vision_model.model.layer1.2.bn1.weight", "vision_model.model.layer1.2.bn1.bias", "vision_model.model.layer1.2.bn1.running_mean", "vision_model.model.layer1.2.bn1.running_var", "vision_model.model.layer1.2.conv2.weight", "vision_model.model.layer1.2.bn2.weight", "vision_model.model.layer1.2.bn2.bias", "vision_model.model.layer1.2.bn2.running_mean", "vision_model.model.layer1.2.bn2.running_var", "vision_model.model.layer1.2.conv3.weight", "vision_model.model.layer1.2.bn3.weight", "vision_model.model.layer1.2.bn3.bias", "vision_model.model.layer1.2.bn3.running_mean", "vision_model.model.layer1.2.bn3.running_var", "vision_model.model.layer2.0.conv1.weight", "vision_model.model.layer2.0.bn1.weight", "vision_model.model.layer2.0.bn1.bias", "vision_model.model.layer2.0.bn1.running_mean", "vision_model.model.layer2.0.bn1.running_var", "vision_model.model.layer2.0.conv2.weight", "vision_model.model.layer2.0.bn2.weight", "vision_model.model.layer2.0.bn2.bias", "vision_model.model.layer2.0.bn2.running_mean", "vision_model.model.layer2.0.bn2.running_var", "vision_model.model.layer2.0.conv3.weight", "vision_model.model.layer2.0.bn3.weight", "vision_model.model.layer2.0.bn3.bias", "vision_model.model.layer2.0.bn3.running_mean", "vision_model.model.layer2.0.bn3.running_var", "vision_model.model.layer2.0.downsample.0.weight", "vision_model.model.layer2.0.downsample.1.weight", "vision_model.model.layer2.0.downsample.1.bias", "vision_model.model.layer2.0.downsample.1.running_mean", "vision_model.model.layer2.0.downsample.1.running_var", "vision_model.model.layer2.1.conv1.weight", "vision_model.model.layer2.1.bn1.weight", "vision_model.model.layer2.1.bn1.bias", "vision_model.model.layer2.1.bn1.running_mean", "vision_model.model.layer2.1.bn1.running_var", "vision_model.model.layer2.1.conv2.weight", "vision_model.model.layer2.1.bn2.weight", "vision_model.model.layer2.1.bn2.bias", "vision_model.model.layer2.1.bn2.running_mean", "vision_model.model.layer2.1.bn2.running_var", "vision_model.model.layer2.1.conv3.weight", "vision_model.model.layer2.1.bn3.weight", "vision_model.model.layer2.1.bn3.bias", "vision_model.model.layer2.1.bn3.running_mean", "vision_model.model.layer2.1.bn3.running_var", "vision_model.model.layer2.2.conv1.weight", "vision_model.model.layer2.2.bn1.weight", "vision_model.model.layer2.2.bn1.bias", "vision_model.model.layer2.2.bn1.running_mean", "vision_model.model.layer2.2.bn1.running_var", "vision_model.model.layer2.2.conv2.weight", "vision_model.model.layer2.2.bn2.weight", "vision_model.model.layer2.2.bn2.bias", "vision_model.model.layer2.2.bn2.running_mean", "vision_model.model.layer2.2.bn2.running_var", "vision_model.model.layer2.2.conv3.weight", "vision_model.model.layer2.2.bn3.weight", "vision_model.model.layer2.2.bn3.bias", "vision_model.model.layer2.2.bn3.running_mean", "vision_model.model.layer2.2.bn3.running_var", "vision_model.model.layer2.3.conv1.weight", "vision_model.model.layer2.3.bn1.weight", "vision_model.model.layer2.3.bn1.bias", "vision_model.model.layer2.3.bn1.running_mean", "vision_model.model.layer2.3.bn1.running_var", "vision_model.model.layer2.3.conv2.weight", "vision_model.model.layer2.3.bn2.weight", "vision_model.model.layer2.3.bn2.bias", "vision_model.model.layer2.3.bn2.running_mean", "vision_model.model.layer2.3.bn2.running_var", "vision_model.model.layer2.3.conv3.weight", "vision_model.model.layer2.3.bn3.weight", "vision_model.model.layer2.3.bn3.bias", "vision_model.model.layer2.3.bn3.running_mean", "vision_model.model.layer2.3.bn3.running_var", "vision_model.model.layer3.0.conv1.weight", "vision_model.model.layer3.0.bn1.weight", "vision_model.model.layer3.0.bn1.bias", "vision_model.model.layer3.0.bn1.running_mean", "vision_model.model.layer3.0.bn1.running_var", "vision_model.model.layer3.0.conv2.weight", "vision_model.model.layer3.0.bn2.weight", "vision_model.model.layer3.0.bn2.bias", "vision_model.model.layer3.0.bn2.running_mean", "vision_model.model.layer3.0.bn2.running_var", "vision_model.model.layer3.0.conv3.weight", "vision_model.model.layer3.0.bn3.weight", "vision_model.model.layer3.0.bn3.bias", "vision_model.model.layer3.0.bn3.running_mean", "vision_model.model.layer3.0.bn3.running_var", "vision_model.model.layer3.0.downsample.0.weight", "vision_model.model.layer3.0.downsample.1.weight", "vision_model.model.layer3.0.downsample.1.bias", "vision_model.model.layer3.0.downsample.1.running_mean", "vision_model.model.layer3.0.downsample.1.running_var", "vision_model.model.layer3.1.conv1.weight", "vision_model.model.layer3.1.bn1.weight", "vision_model.model.layer3.1.bn1.bias", "vision_model.model.layer3.1.bn1.running_mean", "vision_model.model.layer3.1.bn1.running_var", "vision_model.model.layer3.1.conv2.weight", "vision_model.model.layer3.1.bn2.weight", "vision_model.model.layer3.1.bn2.bias", "vision_model.model.layer3.1.bn2.running_mean", "vision_model.model.layer3.1.bn2.running_var", "vision_model.model.layer3.1.conv3.weight", "vision_model.model.layer3.1.bn3.weight", "vision_model.model.layer3.1.bn3.bias", "vision_model.model.layer3.1.bn3.running_mean", "vision_model.model.layer3.1.bn3.running_var", "vision_model.model.layer3.2.conv1.weight", "vision_model.model.layer3.2.bn1.weight", "vision_model.model.layer3.2.bn1.bias", "vision_model.model.layer3.2.bn1.running_mean", "vision_model.model.layer3.2.bn1.running_var", "vision_model.model.layer3.2.conv2.weight", "vision_model.model.layer3.2.bn2.weight", "vision_model.model.layer3.2.bn2.bias", "vision_model.model.layer3.2.bn2.running_mean", "vision_model.model.layer3.2.bn2.running_var", "vision_model.model.layer3.2.conv3.weight", "vision_model.model.layer3.2.bn3.weight", "vision_model.model.layer3.2.bn3.bias", "vision_model.model.layer3.2.bn3.running_mean", "vision_model.model.layer3.2.bn3.running_var", "vision_model.model.layer3.3.conv1.weight", "vision_model.model.layer3.3.bn1.weight", "vision_model.model.layer3.3.bn1.bias", "vision_model.model.layer3.3.bn1.running_mean", "vision_model.model.layer3.3.bn1.running_var", "vision_model.model.layer3.3.conv2.weight", "vision_model.model.layer3.3.bn2.weight", "vision_model.model.layer3.3.bn2.bias", "vision_model.model.layer3.3.bn2.running_mean", "vision_model.model.layer3.3.bn2.running_var", "vision_model.model.layer3.3.conv3.weight", "vision_model.model.layer3.3.bn3.weight", "vision_model.model.layer3.3.bn3.bias", "vision_model.model.layer3.3.bn3.running_mean", "vision_model.model.layer3.3.bn3.running_var", "vision_model.model.layer3.4.conv1.weight", "vision_model.model.layer3.4.bn1.weight", "vision_model.model.layer3.4.bn1.bias", "vision_model.model.layer3.4.bn1.running_mean", "vision_model.model.layer3.4.bn1.running_var", "vision_model.model.layer3.4.conv2.weight", "vision_model.model.layer3.4.bn2.weight", "vision_model.model.layer3.4.bn2.bias", "vision_model.model.layer3.4.bn2.running_mean", "vision_model.model.layer3.4.bn2.running_var", "vision_model.model.layer3.4.conv3.weight", "vision_model.model.layer3.4.bn3.weight", "vision_model.model.layer3.4.bn3.bias", "vision_model.model.layer3.4.bn3.running_mean", "vision_model.model.layer3.4.bn3.running_var", "vision_model.model.layer3.5.conv1.weight", "vision_model.model.layer3.5.bn1.weight", "vision_model.model.layer3.5.bn1.bias", "vision_model.model.layer3.5.bn1.running_mean", "vision_model.model.layer3.5.bn1.running_var", "vision_model.model.layer3.5.conv2.weight", "vision_model.model.layer3.5.bn2.weight", "vision_model.model.layer3.5.bn2.bias", "vision_model.model.layer3.5.bn2.running_mean", "vision_model.model.layer3.5.bn2.running_var", "vision_model.model.layer3.5.conv3.weight", "vision_model.model.layer3.5.bn3.weight", "vision_model.model.layer3.5.bn3.bias", "vision_model.model.layer3.5.bn3.running_mean", "vision_model.model.layer3.5.bn3.running_var", "vision_model.model.layer4.0.conv1.weight", "vision_model.model.layer4.0.bn1.weight", "vision_model.model.layer4.0.bn1.bias", "vision_model.model.layer4.0.bn1.running_mean", "vision_model.model.layer4.0.bn1.running_var", "vision_model.model.layer4.0.conv2.weight", "vision_model.model.layer4.0.bn2.weight", "vision_model.model.layer4.0.bn2.bias", "vision_model.model.layer4.0.bn2.running_mean", "vision_model.model.layer4.0.bn2.running_var", "vision_model.model.layer4.0.conv3.weight", "vision_model.model.layer4.0.bn3.weight", "vision_model.model.layer4.0.bn3.bias", "vision_model.model.layer4.0.bn3.running_mean", "vision_model.model.layer4.0.bn3.running_var", "vision_model.model.layer4.0.downsample.0.weight", "vision_model.model.layer4.0.downsample.1.weight", "vision_model.model.layer4.0.downsample.1.bias", "vision_model.model.layer4.0.downsample.1.running_mean", "vision_model.model.layer4.0.downsample.1.running_var", "vision_model.model.layer4.1.conv1.weight", "vision_model.model.layer4.1.bn1.weight", "vision_model.model.layer4.1.bn1.bias", "vision_model.model.layer4.1.bn1.running_mean", "vision_model.model.layer4.1.bn1.running_var", "vision_model.model.layer4.1.conv2.weight", "vision_model.model.layer4.1.bn2.weight", "vision_model.model.layer4.1.bn2.bias", "vision_model.model.layer4.1.bn2.running_mean", "vision_model.model.layer4.1.bn2.running_var", "vision_model.model.layer4.1.conv3.weight", "vision_model.model.layer4.1.bn3.weight", "vision_model.model.layer4.1.bn3.bias", "vision_model.model.layer4.1.bn3.running_mean", "vision_model.model.layer4.1.bn3.running_var", "vision_model.model.layer4.2.conv1.weight", "vision_model.model.layer4.2.bn1.weight", "vision_model.model.layer4.2.bn1.bias", "vision_model.model.layer4.2.bn1.running_mean", "vision_model.model.layer4.2.bn1.running_var", "vision_model.model.layer4.2.conv2.weight", "vision_model.model.layer4.2.bn2.weight", "vision_model.model.layer4.2.bn2.bias", "vision_model.model.layer4.2.bn2.running_mean", "vision_model.model.layer4.2.bn2.running_var", "vision_model.model.layer4.2.conv3.weight", "vision_model.model.layer4.2.bn3.weight", "vision_model.model.layer4.2.bn3.bias", "vision_model.model.layer4.2.bn3.running_mean", "vision_model.model.layer4.2.bn3.running_var", "vision_model.model.fc.weight". Unexpected key(s) in state_dict: "vision_model.projection_head.weight", "vision_model.model.embeddings.patch_embeddings.projection.weight", "vision_model.model.embeddings.patch_embeddings.projection.bias", "vision_model.model.embeddings.norm.weight", "vision_model.model.embeddings.norm.bias", "vision_model.model.encoder.layers.0.blocks.0.layernorm_before.weight", "vision_model.model.encoder.layers.0.blocks.0.layernorm_before.bias", "vision_model.model.encoder.layers.0.blocks.0.attention.self.relative_position_bias_table", "vision_model.model.encoder.layers.0.blocks.0.attention.self.relative_position_index", "vision_model.model.encoder.layers.0.blocks.0.attention.self.query.weight", "vision_model.model.encoder.layers.0.blocks.0.attention.self.query.bias", "vision_model.model.encoder.layers.0.blocks.0.attention.self.key.weight", "vision_model.model.encoder.layers.0.blocks.0.attention.self.key.bias", "vision_model.model.encoder.layers.0.blocks.0.attention.self.value.weight", "vision_model.model.encoder.layers.0.blocks.0.attention.self.value.bias", "vision_model.model.encoder.layers.0.blocks.0.attention.output.dense.weight", "vision_model.model.encoder.layers.0.blocks.0.attention.output.dense.bias", "vision_model.model.encoder.layers.0.blocks.0.layernorm_after.weight", "vision_model.model.encoder.layers.0.blocks.0.layernorm_after.bias", "vision_model.model.encoder.layers.0.blocks.0.intermediate.dense.weight", "vision_model.model.encoder.layers.0.blocks.0.intermediate.dense.bias", "vision_model.model.encoder.layers.0.blocks.0.output.dense.weight", "vision_model.model.encoder.layers.0.blocks.0.output.dense.bias", "vision_model.model.encoder.layers.0.blocks.1.layernorm_before.weight", "vision_model.model.encoder.layers.0.blocks.1.layernorm_before.bias", "vision_model.model.encoder.layers.0.blocks.1.attention.self.relative_position_bias_table", "vision_model.model.encoder.layers.0.blocks.1.attention.self.relative_position_index", "vision_model.model.encoder.layers.0.blocks.1.attention.self.query.weight", "vision_model.model.encoder.layers.0.blocks.1.attention.self.query.bias", "vision_model.model.encoder.layers.0.blocks.1.attention.self.key.weight", "vision_model.model.encoder.layers.0.blocks.1.attention.self.key.bias", "vision_model.model.encoder.layers.0.blocks.1.attention.self.value.weight", "vision_model.model.encoder.layers.0.blocks.1.attention.self.value.bias", "vision_model.model.encoder.layers.0.blocks.1.attention.output.dense.weight", "vision_model.model.encoder.layers.0.blocks.1.attention.output.dense.bias", "vision_model.model.encoder.layers.0.blocks.1.layernorm_after.weight", "vision_model.model.encoder.layers.0.blocks.1.layernorm_after.bias", "vision_model.model.encoder.layers.0.blocks.1.intermediate.dense.weight", "vision_model.model.encoder.layers.0.blocks.1.intermediate.dense.bias", "vision_model.model.encoder.layers.0.blocks.1.output.dense.weight", "vision_model.model.encoder.layers.0.blocks.1.output.dense.bias", "vision_model.model.encoder.layers.0.downsample.reduction.weight", "vision_model.model.encoder.layers.0.downsample.norm.weight", "vision_model.model.encoder.layers.0.downsample.norm.bias", "vision_model.model.encoder.layers.1.blocks.0.layernorm_before.weight", "vision_model.model.encoder.layers.1.blocks.0.layernorm_before.bias", "vision_model.model.encoder.layers.1.blocks.0.attention.self.relative_position_bias_table", "vision_model.model.encoder.layers.1.blocks.0.attention.self.relative_position_index", "vision_model.model.encoder.layers.1.blocks.0.attention.self.query.weight", "vision_model.model.encoder.layers.1.blocks.0.attention.self.query.bias", "vision_model.model.encoder.layers.1.blocks.0.attention.self.key.weight", "vision_model.model.encoder.layers.1.blocks.0.attention.self.key.bias", "vision_model.model.encoder.layers.1.blocks.0.attention.self.value.weight", "vision_model.model.encoder.layers.1.blocks.0.attention.self.value.bias", "vision_model.model.encoder.layers.1.blocks.0.attention.output.dense.weight", "vision_model.model.encoder.layers.1.blocks.0.attention.output.dense.bias", "vision_model.model.encoder.layers.1.blocks.0.layernorm_after.weight", "vision_model.model.encoder.layers.1.blocks.0.layernorm_after.bias", "vision_model.model.encoder.layers.1.blocks.0.intermediate.dense.weight", "vision_model.model.encoder.layers.1.blocks.0.intermediate.dense.bias", "vision_model.model.encoder.layers.1.blocks.0.output.dense.weight", "vision_model.model.encoder.layers.1.blocks.0.output.dense.bias", "vision_model.model.encoder.layers.1.blocks.1.layernorm_before.weight", "vision_model.model.encoder.layers.1.blocks.1.layernorm_before.bias", "vision_model.model.encoder.layers.1.blocks.1.attention.self.relative_position_bias_table", "vision_model.model.encoder.layers.1.blocks.1.attention.self.relative_position_index", "vision_model.model.encoder.layers.1.blocks.1.attention.self.query.weight", "vision_model.model.encoder.layers.1.blocks.1.attention.self.query.bias", "vision_model.model.encoder.layers.1.blocks.1.attention.self.key.weight", "vision_model.model.encoder.layers.1.blocks.1.attention.self.key.bias", "vision_model.model.encoder.layers.1.blocks.1.attention.self.value.weight", "vision_model.model.encoder.layers.1.blocks.1.attention.self.value.bias", "vision_model.model.encoder.layers.1.blocks.1.attention.output.dense.weight", "vision_model.model.encoder.layers.1.blocks.1.attention.output.dense.bias", "vision_model.model.encoder.layers.1.blocks.1.layernorm_after.weight", "vision_model.model.encoder.layers.1.blocks.1.layernorm_after.bias", "vision_model.model.encoder.layers.1.blocks.1.intermediate.dense.weight", "vision_model.model.encoder.layers.1.blocks.1.intermediate.dense.bias", "vision_model.model.encoder.layers.1.blocks.1.output.dense.weight", "vision_model.model.encoder.layers.1.blocks.1.output.dense.bias", "vision_model.model.encoder.layers.1.downsample.reduction.weight", "vision_model.model.encoder.layers.1.downsample.norm.weight", "vision_model.model.encoder.layers.1.downsample.norm.bias", "vision_model.model.encoder.layers.2.blocks.0.layernorm_before.weight", "vision_model.model.encoder.layers.2.blocks.0.layernorm_before.bias", "vision_model.model.encoder.layers.2.blocks.0.attention.self.relative_position_bias_table", "vision_model.model.encoder.layers.2.blocks.0.attention.self.relative_position_index", "vision_model.model.encoder.layers.2.blocks.0.attention.self.query.weight", "vision_model.model.encoder.layers.2.blocks.0.attention.self.query.bias", "vision_model.model.encoder.layers.2.blocks.0.attention.self.key.weight", "vision_model.model.encoder.layers.2.blocks.0.attention.self.key.bias", "vision_model.model.encoder.layers.2.blocks.0.attention.self.value.weight", "vision_model.model.encoder.layers.2.blocks.0.attention.self.value.bias", "vision_model.model.encoder.layers.2.blocks.0.attention.output.dense.weight", "vision_model.model.encoder.layers.2.blocks.0.attention.output.dense.bias", "vision_model.model.encoder.layers.2.blocks.0.layernorm_after.weight", "vision_model.model.encoder.layers.2.blocks.0.layernorm_after.bias", "vision_model.model.encoder.layers.2.blocks.0.intermediate.dense.weight", "vision_model.model.encoder.layers.2.blocks.0.intermediate.dense.bias", "vision_model.model.encoder.layers.2.blocks.0.output.dense.weight", "vision_model.model.encoder.layers.2.blocks.0.output.dense.bias", "vision_model.model.encoder.layers.2.blocks.1.layernorm_before.weight", "vision_model.model.encoder.layers.2.blocks.1.layernorm_before.bias", "vision_model.model.encoder.layers.2.blocks.1.attention.self.relative_position_bias_table", "vision_model.model.encoder.layers.2.blocks.1.attention.self.relative_position_index", "vision_model.model.encoder.layers.2.blocks.1.attention.self.query.weight", "vision_model.model.encoder.layers.2.blocks.1.attention.self.query.bias", "vision_model.model.encoder.layers.2.blocks.1.attention.self.key.weight", "vision_model.model.encoder.layers.2.blocks.1.attention.self.key.bias", "vision_model.model.encoder.layers.2.blocks.1.attention.self.value.weight", "vision_model.model.encoder.layers.2.blocks.1.attention.self.value.bias", "vision_model.model.encoder.layers.2.blocks.1.attention.output.dense.weight", "vision_model.model.encoder.layers.2.blocks.1.attention.output.dense.bias", "vision_model.model.encoder.layers.2.blocks.1.layernorm_after.weight", "vision_model.model.encoder.layers.2.blocks.1.layernorm_after.bias", "vision_model.model.encoder.layers.2.blocks.1.intermediate.dense.weight", "vision_model.model.encoder.layers.2.blocks.1.intermediate.dense.bias", "vision_model.model.encoder.layers.2.blocks.1.output.dense.weight", "vision_model.model.encoder.layers.2.blocks.1.output.dense.bias", "vision_model.model.encoder.layers.2.blocks.2.layernorm_before.weight", "vision_model.model.encoder.layers.2.blocks.2.layernorm_before.bias", "vision_model.model.encoder.layers.2.blocks.2.attention.self.relative_position_bias_table", "vision_model.model.encoder.layers.2.blocks.2.attention.self.relative_position_index", "vision_model.model.encoder.layers.2.blocks.2.attention.self.query.weight", "vision_model.model.encoder.layers.2.blocks.2.attention.self.query.bias", "vision_model.model.encoder.layers.2.blocks.2.attention.self.key.weight", "vision_model.model.encoder.layers.2.blocks.2.attention.self.key.bias", "vision_model.model.encoder.layers.2.blocks.2.attention.self.value.weight", "vision_model.model.encoder.layers.2.blocks.2.attention.self.value.bias", "vision_model.model.encoder.layers.2.blocks.2.attention.output.dense.weight", "vision_model.model.encoder.layers.2.blocks.2.attention.output.dense.bias", "vision_model.model.encoder.layers.2.blocks.2.layernorm_after.weight", "vision_model.model.encoder.layers.2.blocks.2.layernorm_after.bias", "vision_model.model.encoder.layers.2.blocks.2.intermediate.dense.weight", "vision_model.model.encoder.layers.2.blocks.2.intermediate.dense.bias", "vision_model.model.encoder.layers.2.blocks.2.output.dense.weight", "vision_model.model.encoder.layers.2.blocks.2.output.dense.bias", "vision_model.model.encoder.layers.2.blocks.3.layernorm_before.weight", "vision_model.model.encoder.layers.2.blocks.3.layernorm_before.bias", "vision_model.model.encoder.layers.2.blocks.3.attention.self.relative_position_bias_table", "vision_model.model.encoder.layers.2.blocks.3.attention.self.relative_position_index", "vision_model.model.encoder.layers.2.blocks.3.attention.self.query.weight", "vision_model.model.encoder.layers.2.blocks.3.attention.self.query.bias", "vision_model.model.encoder.layers.2.blocks.3.attention.self.key.weight", "vision_model.model.encoder.layers.2.blocks.3.attention.self.key.bias", "vision_model.model.encoder.layers.2.blocks.3.attention.self.value.weight", "vision_model.model.encoder.layers.2.blocks.3.attention.self.value.bias", "vision_model.model.encoder.layers.2.blocks.3.attention.output.dense.weight", "vision_model.model.encoder.layers.2.blocks.3.attention.output.dense.bias", "vision_model.model.encoder.layers.2.blocks.3.layernorm_after.weight", "vision_model.model.encoder.layers.2.blocks.3.layernorm_after.bias", "vision_model.model.encoder.layers.2.blocks.3.intermediate.dense.weight", "vision_model.model.encoder.layers.2.blocks.3.intermediate.dense.bias", "vision_model.model.encoder.layers.2.blocks.3.output.dense.weight", "vision_model.model.encoder.layers.2.blocks.3.output.dense.bias", "vision_model.model.encoder.layers.2.blocks.4.layernorm_before.weight", "vision_model.model.encoder.layers.2.blocks.4.layernorm_before.bias", "vision_model.model.encoder.layers.2.blocks.4.attention.self.relative_position_bias_table", "vision_model.model.encoder.layers.2.blocks.4.attention.self.relative_position_index", "vision_model.model.encoder.layers.2.blocks.4.attention.self.query.weight", "vision_model.model.encoder.layers.2.blocks.4.attention.self.query.bias", "vision_model.model.encoder.layers.2.blocks.4.attention.self.key.weight", "vision_model.model.encoder.layers.2.blocks.4.attention.self.key.bias", "vision_model.model.encoder.layers.2.blocks.4.attention.self.value.weight", "vision_model.model.encoder.layers.2.blocks.4.attention.self.value.bias", "vision_model.model.encoder.layers.2.blocks.4.attention.output.dense.weight", "vision_model.model.encoder.layers.2.blocks.4.attention.output.dense.bias", "vision_model.model.encoder.layers.2.blocks.4.layernorm_after.weight", "vision_model.model.encoder.layers.2.blocks.4.layernorm_after.bias", "vision_model.model.encoder.layers.2.blocks.4.intermediate.dense.weight", "vision_model.model.encoder.layers.2.blocks.4.intermediate.dense.bias", "vision_model.model.encoder.layers.2.blocks.4.output.dense.weight", "vision_model.model.encoder.layers.2.blocks.4.output.dense.bias", "vision_model.model.encoder.layers.2.blocks.5.layernorm_before.weight", "vision_model.model.encoder.layers.2.blocks.5.layernorm_before.bias", "vision_model.model.encoder.layers.2.blocks.5.attention.self.relative_position_bias_table", "vision_model.model.encoder.layers.2.blocks.5.attention.self.relative_position_index", "vision_model.model.encoder.layers.2.blocks.5.attention.self.query.weight", "vision_model.model.encoder.layers.2.blocks.5.attention.self.query.bias", "vision_model.model.encoder.layers.2.blocks.5.attention.self.key.weight", "vision_model.model.encoder.layers.2.blocks.5.attention.self.key.bias", "vision_model.model.encoder.layers.2.blocks.5.attention.self.value.weight", "vision_model.model.encoder.layers.2.blocks.5.attention.self.value.bias", "vision_model.model.encoder.layers.2.blocks.5.attention.output.dense.weight", "vision_model.model.encoder.layers.2.blocks.5.attention.output.dense.bias", "vision_model.model.encoder.layers.2.blocks.5.layernorm_after.weight", "vision_model.model.encoder.layers.2.blocks.5.layernorm_after.bias", "vision_model.model.encoder.layers.2.blocks.5.intermediate.dense.weight", "vision_model.model.encoder.layers.2.blocks.5.intermediate.dense.bias", "vision_model.model.encoder.layers.2.blocks.5.output.dense.weight", "vision_model.model.encoder.layers.2.blocks.5.output.dense.bias", "vision_model.model.encoder.layers.2.downsample.reduction.weight", "vision_model.model.encoder.layers.2.downsample.norm.weight", "vision_model.model.encoder.layers.2.downsample.norm.bias", "vision_model.model.encoder.layers.3.blocks.0.layernorm_before.weight", "vision_model.model.encoder.layers.3.blocks.0.layernorm_before.bias", "vision_model.model.encoder.layers.3.blocks.0.attention.self.relative_position_bias_table", "vision_model.model.encoder.layers.3.blocks.0.attention.self.relative_position_index", "vision_model.model.encoder.layers.3.blocks.0.attention.self.query.weight", "vision_model.model.encoder.layers.3.blocks.0.attention.self.query.bias", "vision_model.model.encoder.layers.3.blocks.0.attention.self.key.weight", "vision_model.model.encoder.layers.3.blocks.0.attention.self.key.bias", "vision_model.model.encoder.layers.3.blocks.0.attention.self.value.weight", "vision_model.model.encoder.layers.3.blocks.0.attention.self.value.bias", "vision_model.model.encoder.layers.3.blocks.0.attention.output.dense.weight", "vision_model.model.encoder.layers.3.blocks.0.attention.output.dense.bias", "vision_model.model.encoder.layers.3.blocks.0.layernorm_after.weight", "vision_model.model.encoder.layers.3.blocks.0.layernorm_after.bias", "vision_model.model.encoder.layers.3.blocks.0.intermediate.dense.weight", "vision_model.model.encoder.layers.3.blocks.0.intermediate.dense.bias", "vision_model.model.encoder.layers.3.blocks.0.output.dense.weight", "vision_model.model.encoder.layers.3.blocks.0.output.dense.bias", "vision_model.model.encoder.layers.3.blocks.1.layernorm_before.weight", "vision_model.model.encoder.layers.3.blocks.1.layernorm_before.bias", "vision_model.model.encoder.layers.3.blocks.1.attention.self.relative_position_bias_table", "vision_model.model.encoder.layers.3.blocks.1.attention.self.relative_position_index", "vision_model.model.encoder.layers.3.blocks.1.attention.self.query.weight", "vision_model.model.encoder.layers.3.blocks.1.attention.self.query.bias", "vision_model.model.encoder.layers.3.blocks.1.attention.self.key.weight", "vision_model.model.encoder.layers.3.blocks.1.attention.self.key.bias", "vision_model.model.encoder.layers.3.blocks.1.attention.self.value.weight", "vision_model.model.encoder.layers.3.blocks.1.attention.self.value.bias", "vision_model.model.encoder.layers.3.blocks.1.attention.output.dense.weight", "vision_model.model.encoder.layers.3.blocks.1.attention.output.dense.bias", "vision_model.model.encoder.layers.3.blocks.1.layernorm_after.weight", "vision_model.model.encoder.layers.3.blocks.1.layernorm_after.bias", "vision_model.model.encoder.layers.3.blocks.1.intermediate.dense.weight", "vision_model.model.encoder.layers.3.blocks.1.intermediate.dense.bias", "vision_model.model.encoder.layers.3.blocks.1.output.dense.weight", "vision_model.model.encoder.layers.3.blocks.1.output.dense.bias", "vision_model.model.layernorm.weight", "vision_model.model.layernorm.bias".

When I asked GPT, they answered Error Summary The following issues occurred while loading the model checkpoint:

Warning Messages: Deprecation warnings from torchvision regarding the 'pretrained' parameter and other arguments.

Bio_ClinicalBERT Initialization Warning: Some weights were not used during the initialization of the BERT model. This typically happens when initializing a BERT model from a checkpoint trained on a different task or architecture.

RuntimeError: Errors encountered when loading the state dictionary for MedCLIPModel, with missing keys as follows:

Missing key(s) in state_dict: "vision_model.model.conv1.weight", "vision_model.model.bn1.weight", ..., "vision_model.model.layer3.3.output.dense.bias". Unexpected key(s) in state_dict:

"vision_model.projection_head.weight", "vision_model.model.embeddings.patch_embeddings.projection.weight", ..., "vision_model.model.layernorm.bias". These errors indicate a mismatch between the model architecture and the checkpoint.

ubc-tea / Backdoor_Multimodal_Foundation_Model

python scripts/zero_shot.py #1