ufal / media-irozhlas

0 stars 0 forks source link

TEITOK: odstranit hodnoty/anotace obsahující číslo #30

Closed matyaskopp closed 2 years ago

matyaskopp commented 2 years ago

Výsledky různých dotazů pořád obsahují chyby v anotacích - to je tím, že v datech jsou (teď už) sice jen dvojitě či trojitě anotované soubory, ale v nich zůstaly anotace, na kterých se autoři neshodli. Jsou sice odlišeny indexem na konci (např. PHRASE vs. PHRASE1 a PHRASE2, či SOURCE:anonymous vs. SOURCE:anonymous1), ale to na první pohled není zřejmé. Předkládám ke zvážení, zda tam nenechat jen ty anotace bez indexů, tj. opravdu ty, na kterých se anotátoři shodli.