Closed wellington36 closed 2 years ago
Temos alguns casos que parecem tratar de ADJ em vez de Verb como por exemplo o caso de irritada
na CF267-2
Adelaide critica Emília por esta sair pouco de casa e, em seguida, deixa a sala irritada pela pouca atenção qu lhe é dispensada pela mãe.
╭──────────────────────────────────────────────────────────────────────────────────┮ Adelaide Adelaide PROPN Gender=Fem|Number=Sing nsubj ─┾ critica criticar VERB Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin root │ ┡─╼ Emília Emília PROPN Gender=Fem|Number=Sing obj │ │ ╭─╼ por por ADP _ case │ ┡─┶ esta este PRON Gender=Fem|Number=Sing|PronType=Dem obl │ ┡─┮ sair sair VERB VerbForm=Inf xcomp │ │ ┡─╼ pouco pouco ADV _ advmod │ │ │ ╭─╼ de de ADP _ case │ │ ╰─┶ casa casa NOUN Gender=Fem|Number=Sing obl │ │ ╭─╼ e e CCONJ _ cc │ │ │ ╭─╼ , , PUNCT _ punct │ │ │ ┢─╼ em em ADP _ case │ │ ┢─┾ seguida seguida NOUN Gender=Fem|Number=Sing obl │ │ │ ╰─╼ , , PUNCT _ punct │ ┡─┾ deixa deixar VERB Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin conj │ │ │ ╭─╼ a o DET Definite=Def|Gender=Fem|Number=Sing|PronType=Art det │ │ ╰─┶ sala sala NOUN Gender=Fem|Number=Sing obj │ │ ╰─┮ irritada irritado VERB Gender=Fem|Number=Sing acl │ │ ╭─╼ por por ADP _ case │ │ ┢─╼ a o DET Definite=Def|Gender=Fem|Number=Sing|PronType=Art d
Também o caso de:
Varios casos de lemma de verbo errado são da forma estar VERB
, como em:
casos comentados aqui corrigi e o PR foi aceito, vamos esperar update do grew pra verificar novo resultado da consulta e eventualmente fechar este issue, ok @wellington36 ?
Concordo
oi, typo em:
text = Adelaide critica Emília por esta sair pouco de casa e, em seguida, deixa a sala irritada pela pouca atenção qu lhe é dispensada pela mãe.
sent_id = CF267-2
source = CETENFolha n=267 cad=TV Folha sec=clt-soc sem=94a &W
id = 1125
o que esta' faltando um "e" !
sim, eu já tinha visto o typo e já anotei de acordo. Vide https://github.com/UniversalDependencies/UD_Portuguese-Bosque/commit/0481e5b4fbfb4843d6a987fd96b7afeb2b8f7830#diff-bea4621035a58f6475649810edac10a48bea285bd4691a2b28577c8eeec95894R59
a query ainda retornava 13 casos, todos corrigidos em eb741846d. Podemos aguardar update do grew para confirmar se todos os casos agora foram resolvidos, mas vou fechar dado que
% awk '$3 !~ /r$/ && $4 ~ /VERB/' *.conllu
Já não retorna nenhuma linha.
@arademaker, No contexto do https://github.com/LR-POR/PorGram/issues/19 encontramos 42 casos (inicialmente) de tokens marcados como
Verb
onde o lemma não termina comr
, segue link para os casos: http://match.grew.fr/?corpus=UD_Portuguese-Bosque@dev&custom=6144934e8aba2Dentre os casos, temos CF972-1, onde o token
derrotado
marcado como verbo temlemma=derrotado
.