UniversalDependencies / UD_Portuguese-Bosque

This Universal Dependencies (UD) Portuguese treebank.
Other
48 stars 11 forks source link

verbos modais em molduras suspeitas #376

Open leoalenc opened 2 years ago

leoalenc commented 2 years ago

@arademaker , examinei a anotação do primeiro dos exemplos listados neste comentário:

http://match.grew.fr/data/61743deb584d1/1283.svg

Veja que poder rege, nesse exemplo, um nsubj e um xcomp no infinitivo nu (bare infinitive), ou seja, não introduzido por complementador. A moldura desse verbo nesse caso deveria ser, portanto, '<VERB:act, nsubj, xcomp:Inf>'. No entanto, pela anotação acima, temos '<VERB:act,nsubj,xcomp:de:que+Inf>', como detectei por meio da biblioteca de extração de valências, conforme o comentário. @arademaker, concorda comigo que se trata de erro? As conjunções de e que deveria estar vinculadas como mark a pudessem e não a cair, certo?

arademaker commented 2 years ago

Sim, concordo que a análise desta sentença, assim como muitas especialmente da parte Português Europeu, está bastante estranha. O token dados como verbo, compilação de dados como nsubj de parar?!

image

Eu sugiro:

CP43-5 Nada fez parar esta compilação de dados, nem o receio de que os endereços pudessem cair nas mãos de grupos nazis que ficariam assim a conhecer onde moram os seus «alvos».

─┮  
 │ ╭─╼ Nada PRON nsubj 1 2  
 ╰─┾ fez VERB root 2 0  
   ├─┮ parar VERB xcomp 3 2  
   │ │ ╭─╼ esta DET det 4 5  
   │ ╰─┾ compilação NOUN obj 5 3  
   │   │ ╭─╼ de ADP case 6 7  
   │   ╰─┶ dados NOUN nmod 7 5  
   │ ╭─╼ , PUNCT punct 8 11  
   │ ├─╼ nem CCONJ cc 9 11  
   │ ├─╼ o DET det 10 11  
   ├─┾ receio NOUN conj 11 2  
   │ │ ╭─╼ de SCONJ mark 12 16  
   │ │ ├─╼ que SCONJ mark 13 16  
   │ │ │ ╭─╼ os DET det 14 15  
   │ │ ├─┶ endereços NOUN nsubj 15 16  
   │ ╰─┾ pudessem VERB acl 16 11  
   │   ╰─┮ cair VERB xcomp 17 16  
   │     │ ╭─╼ em ADP case 18 20  
   │     │ ├─╼ as DET det 19 20  
   │     ╰─┾ mãos NOUN obl 20 17  
   │       │ ╭─╼ de ADP case 21 22  
   │       ╰─┾ grupos NOUN nmod 22 20  
   │         ├─╼ nazis ADJ amod 23 22  
   │         │ ╭─╼ que PRON nsubj 24 25  
   │         ╰─┾ ficariam VERB acl:relcl 25 22  
   │           │ ╭─╼ assim ADV advmod 26 28  
   │           │ ├─╼ a SCONJ mark 27 28  
   │           ╰─┾ conhecer VERB xcomp 28 25  
   │             │ ╭─╼ onde PRON obl 29 30  
   │             ╰─┾ moram VERB ccomp 30 28  
   │               │ ╭─╼ os DET det 31 34  
   │               │ ├─╼ seus DET det 32 34  
   │               │ ├─╼ « PUNCT punct 33 34  
   │               ╰─┾ alvos NOUN nsubj 34 30  
   │                 ╰─╼ » PUNCT punct 35 34  
   ╰─╼ . PUNCT punct 36 2  

O que acha?

leoalenc commented 2 years ago

Sim, concordo que a análise desta sentença, assim como muitas especialmente da parte Português Europeu, está bastante estranha. O token dados como verbo, compilação de dados como nsubj de parar?!

image

Eu sugiro:

CP43-5 Nada fez parar esta compilação de dados, nem o receio de que os endereços pudessem cair nas mãos de grupos nazis que ficariam assim a conhecer onde moram os seus «alvos».

─┮  
 │ ╭─╼ Nada PRON nsubj 1 2  
 ╰─┾ fez VERB root 2 0  
   ├─┮ parar VERB xcomp 3 2  
   │ │ ╭─╼ esta DET det 4 5  
   │ ╰─┾ compilação NOUN obj 5 3  
   │   │ ╭─╼ de ADP case 6 7  
   │   ╰─┶ dados NOUN nmod 7 5  
   │ ╭─╼ , PUNCT punct 8 11  
   │ ├─╼ nem CCONJ cc 9 11  
   │ ├─╼ o DET det 10 11  
   ├─┾ receio NOUN conj 11 2  
   │ │ ╭─╼ de SCONJ mark 12 16  
   │ │ ├─╼ que SCONJ mark 13 16  
   │ │ │ ╭─╼ os DET det 14 15  
   │ │ ├─┶ endereços NOUN nsubj 15 16  
   │ ╰─┾ pudessem VERB acl 16 11  
   │   ╰─┮ cair VERB xcomp 17 16  
   │     │ ╭─╼ em ADP case 18 20  
   │     │ ├─╼ as DET det 19 20  
   │     ╰─┾ mãos NOUN obl 20 17  
   │       │ ╭─╼ de ADP case 21 22  
   │       ╰─┾ grupos NOUN nmod 22 20  
   │         ├─╼ nazis ADJ amod 23 22  
   │         │ ╭─╼ que PRON nsubj 24 25  
   │         ╰─┾ ficariam VERB acl:relcl 25 22  
   │           │ ╭─╼ assim ADV advmod 26 28  
   │           │ ├─╼ a SCONJ mark 27 28  
   │           ╰─┾ conhecer VERB xcomp 28 25  
   │             │ ╭─╼ onde PRON obl 29 30  
   │             ╰─┾ moram VERB ccomp 30 28  
   │               │ ╭─╼ os DET det 31 34  
   │               │ ├─╼ seus DET det 32 34  
   │               │ ├─╼ « PUNCT punct 33 34  
   │               ╰─┾ alvos NOUN nsubj 34 30  
   │                 ╰─╼ » PUNCT punct 35 34  
   ╰─╼ . PUNCT punct 36 2  

O que acha?

@arademaker , concordo em tudo.