Open leoalenc opened 3 years ago
em 2bf33bc72, entendemos que a correção seria xcomp(públicas,situações)
-- usando notação dep(token,head)
. Correto?
Outros casos semelhantes seriam:
% awk '$0 ~ /# sent_id/ {sent=$0} $4 ~ /ADJ/ && $8 ~ /advmod/ {print sent,$0}' *
# sent_id = CF831-2 5 junta junta ADJ <mente>|ADJ|F|S|@<ADVL Gender=Fem|Number=Sing 4 advmod _ _
# sent_id = CP27-3 31 pronta pronto ADJ ADJ|F|S|@N<PRED Gender=Fem|Number=Sing 33 advmod _ _
# sent_id = CP206-1 10 loucas louco ADJ <first-cjt>|ADJ|F|P|@<ADVL Gender=Fem|Number=Plur 9 advmod _ SpaceAfter=No
# sent_id = CP261-3 12 mais mais ADJ _ Degree=Cmp 14 advmod _ _
# sent_id = CP458-6 11 inversa inverso ADJ <first-cjt>|<Em>|<mente>|ADJ|F|S|@>N Gender=Fem|Number=Sing 4 advmod _ _
Já o primeiro parece que temos um erro, pode confirmar os outros?
Vide #309 trata de um dos casos acima.
casos obtidos com:
cat documents/*.conllu | udapy -TMN util.Mark node='(node.upos == "ADJ" and node.deprel == "advmod")'
loaded_from = -
# sent_id = CF831-2
# text = A equipe vem treinando junta há pouco tempo.
─┮
│ ╭─╼ A DET det
│ ╭─┶ equipe NOUN nsubj
╰─┾ vem VERB root
╰─┮ treinando VERB xcomp
┡─╼ junta ADJ advmod
│ ╭─╼ há ADP case
│ ┢─╼ pouco DET det
┡─┶ tempo NOUN obl
╰─╼ . PUNCT punct
# sent_id = CP27-3
# text = Desde as 10 horas da manhã, as manobras de entrada do porto eram aguardadas ansiosamente e por três horas toda a guarnição permaneceu no convés, pronta para receber ordens do piloto a bordo do rebocador que coordenou as manobras de atracação ao lado do veleiro Esmeralda, da armada chilena.
─┮
│ ╭─╼ Desde ADP case
│ ┢─╼ as DET det
│ ┢─╼ 10 NUM nummod
│ ╭─┾ horas NOUN obl
│ │ │ ╭─╼ de ADP case
│ │ │ ┢─╼ a DET det
│ │ ┡─┶ manhã NOUN nmod
│ │ ╰─╼ , PUNCT punct
│ │ ╭─╼ as DET det
│ ┢─┾ manobras NOUN nsubj
│ │ │ ╭─╼ de ADP case
│ │ ╰─┾ entrada NOUN nmod
│ │ │ ╭─╼ de ADP case
│ │ │ ┢─╼ o DET det
│ │ ╰─┶ porto NOUN nmod
│ ┢─╼ eram AUX cop
╰─┾ aguardadas VERB root
┡─╼ ansiosamente ADV advmod
│ ╭─╼ e CCONJ cc
│ │ ╭─╼ por ADP case
│ │ ┢─╼ três NUM nummod
│ ┢─┶ horas NOUN obl
│ │ ╭─┮ toda DET det
│ │ │ ╰─╼ a DET fixed
│ ┢─┶ guarnição NOUN nsubj
┡─┾ permaneceu VERB conj
│ │ ╭─╼ em ADP case
│ │ ┢─╼ o DET det
│ ┡─┶ convés NOUN obl
│ │ ╭─╼ , PUNCT punct
│ │ ╭─┶ pronta ADJ advmod
│ │ ┢─╼ para SCONJ mark
│ ╰─┾ receber VERB advcl
│ ╰─┮ ordens NOUN obj
│ │ ╭─╼ de ADP case
│ │ ┢─╼ o DET det
│ ╰─┾ piloto NOUN nmod
│ ╰─┮ a ADV advmod
│ │ ╭─╼ bordo ADP case
│ │ ┢─╼ de ADP case
│ │ ┢─╼ o DET det
│ ╰─┾ rebocador NOUN obl
│ │ ╭─╼ que PRON nsubj
│ ╰─┾ coordenou VERB acl:relcl
│ │ ╭─╼ as DET det
│ ╰─┾ manobras NOUN obj
│ │ ╭─╼ de ADP case
│ ╰─┾ atracação NOUN nmod
│ │ ╭─╼ a ADP case
│ │ ┢─╼ o DET det
│ ╰─┾ lado NOUN nmod
│ │ ╭─╼ de ADP case
│ │ ┢─╼ o DET det
│ ╰─┾ veleiro NOUN nmod
│ ┡─╼ Esmeralda PROPN appos
│ │ ╭─╼ , PUNCT punct
│ │ ┢─╼ de ADP case
│ │ ┢─╼ a DET det
│ ╰─┾ armada NOUN nmod
│ ╰─╼ chilena ADJ amod
╰─╼ . PUNCT punct
# sent_id = CP206-1
# text = «As pessoas que assistem a tais sessões saiem loucas, histéricas, falam alto, as crianças choram», observa a administração daquele condomínio.
─┮
│ ╭─╼ « PUNCT punct
│ │ ╭─╼ As DET det
│ ┢─┾ pessoas NOUN nsubj
│ │ │ ╭─╼ que PRON nsubj
│ │ ╰─┾ assistem VERB acl:relcl
│ │ │ ╭─╼ a ADP case
│ │ │ ┢─╼ tais DET det
│ │ ╰─┶ sessões NOUN obj
│ ╭─┾ saiem VERB ccomp
│ │ ┡─┮ loucas ADJ advmod
│ │ │ │ ╭─╼ , PUNCT punct
│ │ │ ╰─┶ histéricas ADJ conj
│ │ │ ╭─╼ , PUNCT punct
│ │ ┡─┾ falam VERB conj
│ │ │ ╰─╼ alto ADV advmod
│ │ │ ╭─╼ , PUNCT punct
│ │ │ │ ╭─╼ as DET det
│ │ │ ┢─┶ crianças NOUN nsubj
│ │ ┡─┶ choram VERB conj
│ │ ╰─╼ » PUNCT punct
│ ┢─╼ , PUNCT punct
╰─┾ observa VERB root
│ ╭─╼ a DET det
┡─┾ administração NOUN nsubj
│ │ ╭─╼ de ADP case
│ │ ┢─╼ aquele DET det
│ ╰─┶ condomínio NOUN nmod
╰─╼ . PUNCT punct
# sent_id = CP261-3
# text = O Instituto do Consumidor (IC) gastou em 1994 mais de meio milhão de contos sem resultados visíveis, acusa a Associação Portuguesa de Direito do Consumo (APDC), que endereçou uma carta ao primeiro-ministro propondo a «extinção», ainda antes das eleições, daquela estrutura do Ministério do Ambiente.
─┮
│ ╭─╼ O DET det
│ ╭─┾ Instituto PROPN nsubj
│ │ │ ╭─╼ de ADP case
│ │ │ ┢─╼ o DET det
│ │ ┡─┶ Consumidor PROPN nmod
│ │ │ ╭─╼ ( PUNCT punct
│ │ ╰─┾ IC PROPN appos
│ │ ╰─╼ ) PUNCT punct
│ ╭─┾ gastou VERB ccomp
│ │ │ ╭─╼ em ADP case
│ │ ┡─┶ 1994 NUM obl
│ │ │ ╭─╼ mais ADJ advmod
│ │ │ ┢─╼ de ADP case
│ │ │ ╭─┾ meio NUM nummod
│ │ │ │ ╰─╼ milhão NUM flat
│ │ │ ┢─╼ de ADP case
│ │ ┡─┶ contos NOUN obj
│ │ │ ╭─╼ sem ADP case
│ │ ┡─┾ resultados NOUN obl
│ │ │ ╰─╼ visíveis ADJ amod
│ │ ╰─╼ , PUNCT punct
╰─┾ acusa VERB root
│ ╭─╼ a DET det
┡─┾ Associação PROPN nsubj
│ ┡─╼ Portuguesa PROPN flat:name
│ │ ╭─╼ de ADP case
│ ┡─┾ Direito PROPN nmod
│ │ │ ╭─╼ de ADP case
│ │ │ ┢─╼ o DET det
│ │ ╰─┶ Consumo PROPN nmod
│ │ ╭─╼ ( PUNCT punct
│ ┡─┾ APDC PROPN appos
│ │ ╰─╼ ) PUNCT punct
│ │ ╭─╼ , PUNCT punct
│ │ ┢─╼ que PRON nsubj
│ ╰─┾ endereçou VERB acl:relcl
│ │ ╭─╼ uma DET det
│ ┡─┶ carta NOUN obj
│ │ ╭─╼ a ADP case
│ │ ┢─╼ o DET det
│ ┡─┶ primeiro-ministro NOUN iobj
│ ╰─┮ propondo VERB advcl
│ │ ╭─╼ a DET det
│ │ ┢─╼ « PUNCT punct
│ ╰─┾ extinção NOUN obj
│ ┡─╼ » PUNCT punct
│ │ ╭─╼ , PUNCT punct
│ │ ┢─╼ ainda ADV advmod
│ ┡─┾ antes ADV advmod
│ │ │ ╭─╼ de ADP case
│ │ │ ┢─╼ as DET det
│ │ ┡─┶ eleições NOUN obl
│ │ ╰─╼ , PUNCT punct
│ │ ╭─╼ de ADP case
│ │ ┢─╼ aquela DET det
│ ╰─┾ estrutura NOUN nmod
│ │ ╭─╼ de ADP case
│ │ ┢─╼ o DET det
│ ╰─┾ Ministério PROPN nmod
│ │ ╭─╼ de ADP case
│ │ ┢─╼ o DET det
│ ╰─┶ Ambiente PROPN nmod
╰─╼ . PUNCT punct
# sent_id = CP458-6
# text = Uma verdade subjectiva incorporada através de normas sociais e, inversa e complementarmente, práticas sociais que avaliam do grau de integração de cada um.
─┮
│ ╭─╼ Uma DET det
╰─┾ verdade NOUN root
┡─╼ subjectiva ADJ amod
┡─┮ incorporada VERB acl
│ ┡─┮ através ADV advmod
│ │ │ ╭─╼ de ADP case
│ │ ╰──────────────────────────────┾ normas NOUN obl
│ │ ┡─╼ sociais ADJ amod
│ │ │ ╭─╼ e CCONJ cc
│ │ ╭─╼ , PUNCT punct │ │
│ ╰─┾ inversa ADJ advmod │ │
│ │ ╭─╼ e CCONJ cc │ │
│ ┡─┶ complementarmente ADV conj │ │
│ ╰─╼ , PUNCT punct │ │
│ ╰─┾ práticas NOUN conj
│ ┡─╼ sociais ADJ amod
│ │ ╭─╼ que PRON nsubj
│ ╰─┾ avaliam VERB acl:relcl
│ │ ╭─╼ de ADP case
│ │ ┢─╼ o DET det
│ ╰─┾ grau NOUN obj
│ │ ╭─╼ de ADP case
│ ╰─┾ integração NOUN nmod
│ │ ╭─╼ de ADP case
│ ╰─┾ cada DET nmod
│ ╰─╼ um NUM fixed
╰─╼ . PUNCT punct
@arademaker e @wellington36, conforme a documentação, advmod é definida desta forma:
Conforme ressaltei em https://github.com/LR-POR/PorGram/issues/19#issuecomment-903854098, a sentença CP392-7 apresenta diversos problemas. Nesta issue, destaco a análise do termo em negrito:
Não se trata de advmod, uma vez que não é um advérbio, mas um adjetivo, que, ao meu ver, exerce a função de xcomp. De fato, esse adjetivo constitui o que a gramática tradicional denomina predicativo do objeto, enquadrando-se na definição de xcomp:
Acredito que possa haver diversos outros erros desse tipo com verbos que governam um objeto e um predicativo do objeto (i.e., um xcomp). Uma maneira de levantar esses erros é procurar por adjetivos classificados como advmod.