UniversalDependencies / UD_Portuguese-Bosque

This Universal Dependencies (UD) Portuguese treebank.
Other
50 stars 12 forks source link

Verbos sem a feat ```VerbForm``` #343

Closed wellington36 closed 3 years ago

wellington36 commented 3 years ago

@arademaker, No contexto do https://github.com/LR-POR/PorGram/issues/19 encontramos 14 (inicialmente) casos de tokens marcados como Verb com a feat VerbForm="", segue link para os casos: http://match.grew.fr/?corpus=UD_Portuguese-Bosque@dev&custom=61449a759e0b3

Dentre os casos temos CP991-4, onde dirigido é participio passado e deveria ter a feat VerbForm correspondente.

# text = talentoso e bem dirigido
─┮ talentoso talentoso ADJ Gender=Masc|Number=Sing amod
 │ ╭─╼ e e CCONJ _ cc
 │ ┢─╼ bem bem ADV _ advmod
 ╰─┶ dirigido dirigir VERB Gender=Masc|Number=Sing conj
arademaker commented 3 years ago

correto, pode corrigir, usando o http://portaldalinguaportuguesa.org ou MorphoBr para dúvidas quando for o caso de qual VerbForm usar.

wellington36 commented 3 years ago

Também podemos acesar os casos via o seguinte comando:

cat *.conllu | udapy -TMA ud.MarkBugs tests='no-VerbForm' | less -R
arademaker commented 3 years ago

Em https://universaldependencies.org/u/feat/VerbForm.html, vemos que VerbForm=Fin diz

Rule of thumb: if it has non-empty Mood, it is finite. But beware that some tagsets conflate verb forms and moods into one feature.

Me parece que podemos completar Mood para os casos:

% awk '$0 ~ /^[0-9]/ {print FILENAME,$2,$6}' *.conllu | grep "VerbForm=Fin"  | grep -v Mood
CF0670.conllu erra Number=Sing|VerbForm=Fin
CF0670.conllu vence Number=Sing|VerbForm=Fin
CF0716.conllu é VerbForm=Fin
CF0852.conllu seja Gender=Fem|Number=Sing|VerbForm=Fin
CF0884.conllu busca Number=Sing|Person=3|Tense=Pres|VerbForm=Fin
CP0118.conllu quer VerbForm=Fin
CP0118.conllu dizer VerbForm=Fin
wellington36 commented 3 years ago

8dc16ff4bf4ed004106b752a82d8767e3c663aad, close this issue.

arademaker commented 3 years ago

Em c960ea5b3 corrigi as análises completando adequadamente as features de todos os verbos VerbForm=Fin