[bug] incomplete code - Githubissues

Same question. I modify the Huggface's code to load all the available values except deberta.embeddings.position_embeddings.weight and run:

from transformers import DebertaTokenizer, DebertaForMaskedLM
import torch

tokenizer = DebertaTokenizer.from_pretrained('microsoft/deberta-base')
model = DebertaForMaskedLM.from_pretrained('microsoft/deberta-base')

inputs = tokenizer("The capital of France is [MASK].", return_tensors="pt")
labels = tokenizer("The capital of France is Paris.", return_tensors="pt")["input_ids"]

outputs = model(**inputs, labels=labels)
print (outputs.loss)

The loss is 3.85, did I do something wrong?

Thanks, Deming

microsoft / DeBERTa

[bug] incomplete code #20