robertostling / ud-swl

Universal Dependencies for Swedish Sign Language
GNU General Public License v3.0
0 stars 2 forks source link

Annotering: SSLC02_331_UD_MG_161024 #4

Open robertostling opened 8 years ago

robertostling commented 8 years ago

Filen som Moa laddade upp idag har ett antal fel enligt konverteringsprogrammet:

Warning: invalid head "case"
Warning: invalid head ""
Warning: invalid head "aux"
Warning: gaps in tree at 22!
Warning: gaps in tree at 79!
Warning: gaps in tree at 103!
Warning: gaps in tree at 159!
Warning: gaps in tree at 171!
Warning: gaps in tree at 191!

De första tre beror nog på att du råkat blanda ihop index- och UD-raderna i några fall.

Resten är en lista över träd (indexnummer för tecken angivna) där annotering saknas eller är felaktig, du kan använda dem som utgångspunkt när du kollar igenom filen nästa gång.

robertostling commented 8 years ago

Jag har förbättrat felmeddelandena från konverteringsprogrammet, så här följer lite mer detaljerad information.

Längst ner finns programmets felrapporter från Calles senaste fil, och här är en snabb tolkning från min sida:

Converting data/SSLC02_331_UD_MG_161024_CB_proofed.eaf...
Warning: invalid head "" at index 111
Warning: signs 22 and 36 are connected to each other but not to the following signs between them: 23
Warning: signs 79 and 102 are connected to each other but not to the following signs between them: 87, 88, 89, 92, 93, 94, 95, 96, 97, 98, 99, 100
Warning: signs 87 and 94 are connected to each other but not to the following signs between them: 90, 91
Warning: signs 159 and 170 are connected to each other but not to the following signs between them: 166
Warning: signs 191 and 229 are connected to each other but not to the following signs between them: 208
robertostling commented 8 years ago

Calle har fixat det mesta nu, så jag avslutar tråden.

robertostling commented 8 years ago

Två nya fel som mitt program inte hittade tidigare (men som UD-projektet blockerade automatiskt):

Warning: sign 106 is "root" but has index 104
Warning: sign 264 is "conj" but has index 0

Jag har rättat det här manuellt i CoNLL-U-filen så att det inte tvunget måste uppdateras i ELAN före måndag, men förr eller senare borde det göras.

Det här är i Calles nya version av filen, alltså SSLC02_331_UD_CB_proofed.eaf