Open claudiafreitas opened 3 years ago
Para UD, seria corrigir o lemma e usar POS e DEPREL considerando o de
no seu caso. E ainda pode-se usar o Misc e Features para indicar o erro: https://universaldependencies.org/u/feat/Typo.html.
Na prática, prefiro corrigir o texto...
No corpus de textos clínicos, a máquina separou "nao" como "em" "a" "o". Não temos permissão para corrigir o texto. Então, colocamos goeswith e lema e POS considerando "não" para cada token que ficou separado.
Como vcs estão fazendo quando o corpus está errado? Abaixo, onde está "e" deveria ser "de".
Dep? E o lema e pos? Atribuídos como se a palavra estivesse correta? ("de" e "adp", respectivamente)