UniversalDependencies / UD_Portuguese-PUD

Parallel Universal Dependencies.
Other
5 stars 3 forks source link

verb ESTAR copula marked as full verb #39

Closed vcvpaiva closed 4 years ago

vcvpaiva commented 4 years ago

several occurrences of ESTAR considered problematic.

  1. the English version has no copula, but the verb "rests" sent_id = n01002032 text = Então, eu odeio pôr um pouco de pressão em vocês, mas o destino da república está nos seus ombros, disse ele à multidão reunida num campo esportivo da Universidade de Carolina do Norte. texten = “So I hate to put a little pressure on you, but the fate of the republic rests on your shoulders,” he told the crowd gathered on a sports field at the University of North Carolina. 1 Então então ADV RB 4 discourse SpaceAfter=No 2 , , PUNCT , 1 punct 3 eu PRON PRP Case=Nom|Number=Sing|Person=1 4 nsubj 4 odeio VERB VBC Mood=Ind|Number=Sing|Person=1|Tense=Pres 0 root 5 pôr VERB VB 4 xcomp 6 um um DET DT Gender=Masc|Number=Sing 7 det 7 pouco pouco NOUN NN Gender=Masc|Number=Sing 5 obj 8 de de ADP IN 9 case 9 pressão pressão NOUN NN Gender=Fem|Number=Sing 7 nmod 10 em em ADP IN 11 case 11 vocês PRON PRP Number=Plur|Person=3 5 obl SpaceAfter=No 12 , , PUNCT , 13 punct 13 mas CCONJ CC 19 cc 14 o o DET DT Gender=Masc|Number=Sing 15 det 15 destino destino NOUN NN Gender=Masc|Number=Sing 19 nsubj 16-17 da 16 de de ADP INDT 18 case 17 a o DET Gender=Fem|Number=Sing 18 det 18 república república NOUN NN Gender=Fem|Number=Sing 15 nmod 19 está estar VERB VBC Mood=Ind|Number=Sing|Person=3|Tense=Pres 4 conj 20-21 nos 20 em em ADP INDT 23 case 21 os o DET Gender=Masc|Number=Plur 23 det 22 seus seu DET DTP$ Gender=Masc|Number=Plur|PronType=Prs 23 det 23 ombros ombro NOUN NN Gender=Masc|Number=Plur 19 obl SpaceAfter=No 24 , , PUNCT , 25 punct 25 disse dizer VERB VBC Mood=Ind|Number=Sing|Person=3|Tense=Past 4 parataxis 26 ele PRON PRP Case=Nom|Gender=Masc|Number=Sing|Person=3 25 nsubj 27-28 à 27 a a ADP INDT 29 case 28 a o DET Gender=Fem|Number=Sing 29 det 29 multidão multidão NOUN NN Gender=Fem|Number=Sing 25 obl 30 reunida VERB VBN Gender=Fem|Number=Sing 29 acl 31-32 num 31 em em ADP INDT 33 case 32 um um DET Gender=Masc|Number=Sing 33 det 33 campo campo NOUN NN Gender=Masc|Number=Sing 30 obl 34 esportivo esportivo ADJ JJ Gender=Masc|Number=Sing 33 amod 35-36 da 35 de de ADP INDT 37 case 36 a o DET Gender=Fem|Number=Sing 37 det 37 Universidade universidade NOUN NN Gender=Fem|Number=Sing 33 nmod Proper=True 38 de de ADP IN 39 case Proper=True 39 Carolina Carolina PROPN NNP Gender=Fem|Number=Sing 37 nmod 40-41 do Proper=True 40 de de ADP INDT 42 case 41 o o DET Gender=Masc|Number=Sing 42 det 42 Norte norte NOUN NN Gender=Masc|Number=Sing 39 nmod Proper=True|SpaceAfter=No 43 . . PUNCT . 4 punct _

  2. "está" is copula not root.

newdoc id = n01068 sent_id = n01068029 text = O círculo eleitoral está na área do conselho de Kesteven do Norte, onde 62% dos eleitores apoiaram a saída da UE. texten = The constituency is in the council area of North Kesteven, where 62% of voters backed leaving the EU. 1 O o DET DT Gender=Masc|Number=Sing 2 det 2 círculo círculo NOUN NN Gender=Masc|Number=Sing 4 nsubj 3 eleitoral eleitoral ADJ JJ Gender=Masc|Number=Sing 2 amod 4 está estar VERB VBC Mood=Ind|Number=Sing|Person=3|Tense=Pres 0 root 5-6 na 5 em em ADP INDT 7 case 6 a o DET Gender=Fem|Number=Sing 7 det 7 área área NOUN NN Gender=Fem|Number=Sing 4 obl 8-9 do 8 de de ADP INDT 10 case 9 o o DET Gender=Masc|Number=Sing 10 det 10 conselho conselho NOUN NN Gender=Masc|Number=Sing 7 nmod 11 de de ADP IN 12 case 12 Kesteven Kesteven PROPN NNP Gender=Masc|Number=Sing 10 nmod 13-14 do Proper=True 13 de de ADP INDT 15 case 14 o o DET Gender=Masc|Number=Sing 15 det 15 Norte norte NOUN NN Gender=Masc|Number=Sing 12 nmod Proper=True|SpaceAfter=No 16 , , PUNCT , 23 punct 17 onde onde ADV WRB 23 advmod 18 62 NUM CD Gender=Masc 19 nummod SpaceAfter=No 19 % SYM SYM 23 nsubj 20-21 dos 20 de de ADP INDT 22 case 21 os o DET Gender=Masc|Number=Plur 22 det 22 eleitores eleitor NOUN NN Gender=Masc|Number=Plur 19 nmod ToDo=nmod 23 apoiaram apoiar VERB VBC Mood=Ind|Number=Plur|Person=3|Tense=Past 7 acl:relcl 24 a o DET DT Gender=Fem|Number=Sing 25 det 25 saída saída NOUN NN Gender=Fem|Number=Sing 23 obj 26-27 da 26 de de ADP INDT 28 case 27 a o DET Gender=Fem|Number=Sing 28 det 28 UE UE PROPN NNP Gender=Fem|Number=Sing 25 nmod SpaceAfter=No 29 . . PUNCT . 4 punct _

vcvpaiva commented 4 years ago

3. sent_id = n01074015 text = A África do Sul está quase em um beco sem saída e nós temos que conseguir alcançar suas expectativas. texten = South Africa are almost at the point of no return and we have to be able to match their desire. 1 A o DET DT Gender=Fem|Number=Sing 2 det 2 África África PROPN NNP Gender=Fem|Number=Sing 6 nsubj 3-4 do Proper=True 3 de de ADP INDT 5 case 4 o o DET Gender=Masc|Number=Sing 5 det 5 Sul sul NOUN NN Gender=Masc|Number=Sing 2 nmod Proper=True 6 está estar VERB VBC Mood=Ind|Number=Sing|Person=3|Tense=Pres 0 root 7 quase quase ADV RB 6 advmod 8 em em ADP IN 10 case 9 um um DET DT Gender=Masc|Number=Sing 10 det 10 beco beco NOUN NN Gender=Masc|Number=Sing 6 obl 11 sem ADP IN 12 case 12 saída saída NOUN NN Gender=Fem|Number=Sing 10 nmod 13 e e CCONJ CC 17 cc 14 nós PRON PRP Case=Nom|Number=Plur|Person=1 17 nsubj 15 temos ter AUX VBC Mood=Ind|Number=Plur|Person=1|Tense=Pres 17 aux 16 que ADP IN 15 fixed 17 conseguir VERB VB 6 conj 18 alcançar VERB VB 17 xcomp 19 suas PRON DTP$ Gender=Fem|Number=Plur|Number[psor]=Sing|Person=3|PronType=Prs 20 det 20 expectativas expectativa NOUN NN Gender=Fem|Number=Plur 18 obj SpaceAfter=No 21 . . PUNCT . 6 punct

vcvpaiva commented 4 years ago

4. newdoc id = n01079 sent_id = n01079015 text = No canto, está uma menina com um lenço na cabeça e calça jeans, com um ar tão modesto que penso ser outra assistente. texten = In the corner is a girl in a headscarf and jeans who looks so unassuming I think it’s another assistant. 1-2 No 1 Em em ADP INDT 3 case 2 o o DET Gender=Masc|Number=Sing 3 det 3 canto canto NOUN NN Gender=Masc|Number=Sing 5 obl SpaceAfter=No 4 , , PUNCT , 3 punct 5 está estar VERB VBC Mood=Ind|Number=Sing|Person=3|Tense=Pres 0 root 6 uma um DET DT Gender=Fem|Number=Sing 7 det 7 menina menino NOUN NN Gender=Fem|Number=Sing 5 nsubj 8 com ADP IN 10 case 9 um um DET DT Gender=Masc|Number=Sing 10 det 10 lenço lenço NOUN NN Gender=Masc|Number=Sing 7 nmod 11-12 na 11 em em ADP INDT 13 case 12 a o DET Gender=Fem|Number=Sing 13 det 13 cabeça cabeça NOUN NN Gender=Fem|Number=Sing 10 nmod 14 e e CCONJ CC 15 cc 15 calça calça NOUN NN Gender=Fem|Number=Sing 10 conj 16 jeans jeans ADJ JJ Gender=Fem|Number=Sing 15 amod SpaceAfter=No 17 , , PUNCT , 20 punct

vcvpaiva commented 4 years ago
  1. sent_id = n01105013 text = Mas agora tudo está fora de questão e ele parece estar à procura de respostas a toda hora. texten = But right now everything is out of kilter and he seems to be seeking answers all the time. 1 Mas CCONJ CC 4 discourse 2 agora agora ADV RB 4 advmod 3 tudo NOUN NN Gender=Masc|Number=Sing 4 nsubj 4 está estar VERB VBC Mood=Ind|Number=Sing|Person=3|Tense=Pres 0 root 5 fora fora ADV RB 4 advmod 6 de de ADP IN 7 case 7 questão questão NOUN NN Gender=Fem|Number=Sing 5 obl 8 e e CCONJ CC 10 cc 9 ele PRON PRP Case=Nom|Gender=Masc|Number=Sing|Person=3 10 nsubj 10 parece parecer VERB VBC Mood=Ind|Number=Sing|Person=3|Tense=Pres 4 conj 11 estar VERB VB 10 xcomp 12-13 à 12 a a ADP INDT 14 case 13 a o DET Gender=Fem|Number=Sing 14 det 14 procura procura NOUN NN Gender=Fem|Number=Sing 11 obl 15 de de ADP IN 16 case 16 respostas resposta NOUN NN Gender=Fem|Number=Plur 14 nmod 17 a ADP IN 19 case 18 toda DET DT Gender=Fem|Number=Sing 19 det 19 hora hora NOUN NN Gender=Fem|Number=Sing 10 obl SpaceAfter=No 20 . . PUNCT . 4 punct _

vcvpaiva commented 4 years ago

6. sent_id = w01027035 text = O norte da Argélia está na zona temperada e goza de um clima mediterrânico suave. texten = Northern Algeria is in the temperate zone and enjoys a mild, Mediterranean climate. 1 O o DET DT Gender=Masc|Number=Sing 2 det 2 norte norte NOUN NN Gender=Masc|Number=Sing 6 nsubj 3-4 da 3 de de ADP INDT 5 case 4 a o DET Gender=Fem|Number=Sing 5 det 5 Argélia Argélia PROPN NNP Gender=Fem|Number=Sing 2 nmod 6 está estar VERB VBC Mood=Ind|Number=Sing|Person=3|Tense=Pres 0 root 7-8 na 7 em em ADP INDT 9 case 8 a o DET Gender=Fem|Number=Sing 9 det 9 zona zona NOUN NN Gender=Fem|Number=Sing 6 obl 10 temperada temperado ADJ JJ Gender=Fem|Number=Sing 9 amod 11 e e CCONJ CC 12 cc 12 goza gozar VERB VBC Mood=Ind|Number=Sing|Person=3|Tense=Pres 6 conj 13 de de ADP IN 15 case 14 um um DET DT Gender=Masc|Number=Sing 15 det 15 clima clima NOUN NN Gender=Masc|Number=Sing 12 obl 16 mediterrânico mediterrânico ADJ JJ Gender=Masc|Number=Sing 15 amod 17 suave suave ADJ JJ Gender=Masc|Number=Sing 15 amod SpaceAfter=No 18 . . PUNCT . 6 punct _

vcvpaiva commented 4 years ago

7. newdoc id = w01041 sent_id = w01041046 text = No entanto, na Tailândia, a urbanização também esteve na origem de aumentos maciços de problemas como a obesidade. # texten = However, in Thailand, urbanization has also resulted in massive increases in problems such as obesity. 1-2 No 1 Em em ADP INDT 12 discourse 2 o o DET Gender=Masc|Number=Sing 1 fixed 3 entanto NOUN NN Gender=Masc|Number=Sing 1 fixed SpaceAfter=No 4 , , PUNCT , 1 punct 5-6 na 5 em em ADP INDT 7 case 6 a o DET Gender=Fem|Number=Sing 7 det 7 Tailândia Tailândia PROPN NNP Gender=Fem|Number=Sing 12 obl SpaceAfter=No 8 , , PUNCT , 7 punct 9 a o DET DT Gender=Fem|Number=Sing 10 det 10 urbanização urbanização NOUN NN Gender=Fem|Number=Sing 12 nsubj 11 também também ADV RB 12 advmod 12 esteve estar VERB VBC Mood=Ind|Number=Sing|Person=3|Tense=Past 0 root 13-14 na 13 em em ADP INDT 15 case 14 a o DET Gender=Fem|Number=Sing 15 det 15 origem origem NOUN NN Gender=Fem|Number=Sing 12 obl 16 de de ADP IN 17 case 17 aumentos aumento NOUN NN Gender=Masc|Number=Plur 15 nmod 18 maciços maciço ADJ JJ Gender=Masc|Number=Plur 17 amod 19 de de ADP IN 20 case 20 problemas problema NOUN NN Gender=Masc|Number=Plur 17 nmod 21 como como ADP IN 23 case 22 a o DET DT Gender=Fem|Number=Sing 23 det 23 obesidade obesidade NOUN NN Gender=Fem|Number=Sing 20 nmod SpaceAfter=No 24 . . PUNCT . 12 punct

vcvpaiva commented 4 years ago
  1. missing quotes too: newdoc id = n03008 sent_id = n03008011 text = ETA está de saída, o contigente Francês revelou. texten = "ETA is on its way out," the French contingent revealed. 1 ETA ETA PROPN NNP Gender=Masc|Number=Sing 2 nsubj 2 está estar VERB VBC Mood=Ind|Number=Sing|Person=3|Tense=Pres 0 root 3 de de ADP IN 4 case 4 saída saída NOUN NN Gender=Fem|Number=Sing 2 obl SpaceAfter=No 5 , , PUNCT , 9 punct 6 o o DET DT Gender=Masc|Number=Sing 7 det 7 contigente NOUN NN Gender=Masc|Number=Sing 9 nsubj 8 Francês francês ADJ JJ Gender=Masc|Number=Sing 7 amod 9 revelou revelar VERB VBC Mood=Ind|Number=Sing|Person=3|Tense=Past 2 parataxis SpaceAfter=No 10 . . PUNCT . 2 punct _
dan-zeman commented 4 years ago

Fixed estar in all eight sentences, closing the issue. The missing quotes perhaps belong to another issue.

vcvpaiva commented 4 years ago

thanks!

arademaker commented 4 years ago

For n01002032 I would prefer having disse as root and the whole discourse being cited as dependent of the verb disse (say)... but I will consider this issue closed.

dan-zeman commented 4 years ago

If it's just about personal preferences, I'd prefer that too, but it would be against the guidelines, specifically the example 10 here.

arademaker commented 4 years ago

Wow! In Bosque, I am adopting the ccomp analysis in general... More work to be done.