Closed jwijffels closed 3 years ago
Of course I'm willing to help. You should set num_labels
to 26
instead of 25
. If you look at the output, you can see that there are 26
labels:
➤ Loading data from train.tsv
dataset has 26 labels
➤ Cached data in cache/getuigenissen-ner-bertje/train.tsv.pkl
Train data: 1402 examples, 26 labels: ['O', 'b-activiteit', 'b-bedrag', 'b-beroep', 'b-beschrijving', 'b-citaat', 'b-emotie', 'b-geo', 'b-leeftijd', 'b-misdrijf', 'b-object', 'b-persoon', 'b-tijd', 'i-activiteit', 'i-bedrag', 'i-beroep', 'i-beschrijving', 'i-citaat', 'i-emotie', 'i-geo', 'i-leeftijd', 'i-misdrijf', 'i-object', 'i-persoon', 'i-tijd', 'o']`
EDIT: Actually, you should keep the number of labels at 25
and upper/lower (do not remember which one) your o
label. You now have an upper and lower case variant. One of them is automatically added, so you should match the one that is automatically added.
Ha, daarvan. Ik snapte al niet waarom dit niet matchte met het aantal categorieën in mijn train.tsv bestand. Ik probeer even met uppercasing.
Thanks for the help. I've uppercased all the categories and now it started training. https://colab.research.google.com/drive/16zr_LJOfVqPquGV8Idk1y1XhjyFDewJV?usp=sharing Feel free to provide feedback if this training run seems fine on Google Colab. I'll close the issue already. Thanks again for your time so far.
Ik weet niet of je wat open staat om hulp te verlenen. Ik krijg volgende error in een named entity recognition finetuning task die ik laat lopen op Google Colab. Dit is mijn config:
En deze error krijg ik bij het starten van het finetunen:
python main.py data/getuigenissen-ner