UniversalDependencies / UD_Portuguese-Bosque

This Universal Dependencies (UD) Portuguese treebank.
Other
49 stars 12 forks source link

problematic sentences #15

Open livyreal opened 8 years ago

livyreal commented 8 years ago

General issue to report wrong sentences or very complicated.

For reference:

  1. Bosque 7.5 Universal dependencies, file bosque_CP.udep.conll.gz,
  2. Bosque 7.5 Universal dependencies, file bosque_CF.udep.conll.gz
  3. Bosque version 7.3, converted by Dan Zeman available in http://github.com/UniversalDependencies/UD_Portuguese
  4. Linguateca Version of Bosque CoNLL (7.3), http://www.linguateca.pt/floresta/CoNLL-X/

Examples from [1]:

"Como num gesto final de rendição, o cabo deu-me os binóculos que trazia e afirmou: «um presente-- para si.»" related to #2 and #5

"Na localidade de Flamengos, onde ainda estão mais de 200 pessoas a dormir em tendas, Sampaio apelou ao «bom senso e solidariedade típica do povo açoreano» para «compreender que não se podem construir todas as casas ao mesmo tempo»." related to #18

livyreal commented 8 years ago

in [1], capaz should be masculine. somehow related to #26

CP65-3 O Governo inaugurou pontes e estradas, mas «não foi capaz de inaugurar» uma Lei de Bases do Ordenamento do Território.

1   O   o   DET ART_M_S_@>N PronType=Art|Number=Sing|Gender=Masc    2   det  
2   Governo Governo PROPN   PROP_M_S_@SUBJ> Number=Sing|Number=Sing|Gender=Masc 3   nsubj  
3   inaugurou   inaugurar   VERB    V_PS_3S_IND_@FS-STA Mood=Ind|Tense=Pret|Person=3|Number=Sing    0   root  
4   pontes  ponte   NOUN    N_F_P_@<ACC Number=Plur|Gender=Fem  3   dobj        
5   e   e   CONJ    KC_@CO  _   4   cc      
6   estradas    estrada NOUN    N_F_P_@<ACC Number=Plur|Gender=Fem  4   conj        
7   ,   ,   PUNCT   PU_@PU  _   3   punct       
8   mas mas CONJ    KC_@CO  _   3   cc      
9   «  «  PUNCT   PU_@PU  _   12  punct       
10  não    não    ADV ADV_@ADVL>  _   12  neg  
11  foi ser VERB    V_PS_3S_IND_@FS-STA Mood=Ind|Tense=Pret|Person=3|Number=Sing    12  cop  
`12 capaz   capaz   ADJ ADJ_F_S_@<SC    _   3   conj`
13  de  de  ADP PRP_@A<ARG  _   14  mark        
14  inaugurar   inaugurar   VERB    V_INF_@ICL-P<   VerbForm=Inf    12  advcl       
15  »  »  PUNCT   PU_@PU  _   12  punct       
16  uma um  DET ART_F_S_@>N PronType=Art|Number=Sing|Gender=Fem 17  det  
17  Lei_de_Bases_do_Ordenamento_do_Território  Lei_de_Bases_do_Ordenamento_do_Território  PROPN   PROP_F_S_@<ACC  Number=Sing|Number=Sing|Gender=Fem  14  dobj  
18  .   .   PUNCT   PU_@PU  _   3   punct   
livyreal commented 8 years ago

a sério adv?

id="5058" ref="CP984-4" source="CETEMPúblico n=984 sec=nd sem=94b" forest="1" text="Gosto de levar a sério o meu papel de consultor encartado.">

1   Gosto   gostar  VERB    <mv>|V|PR|1S|IND|@FS-STA    Mood=Ind|Tense=Pres|Person=1|Number=Sing    0   root    _   _
2   de  de  ADP PRP|@<PIV   _   3   mark    _   _
3   levar   levar   VERB    <mv>|V|INF|@ICL-P<  _   1   xcomp   _   _
4   a_sério    a_sério    ADJ ADJ|M/F|S/P|@<OC    _   3   xcomp   _   _
5   o   o   DET <artd>|ART|M|S|@>N  Gender=Masc|Number=Sing 7   det _   _
6   meu meu DET <poss>|DET|M|S|@>N  Gender=Masc|Number=Sing 7   det _   _
7   papel   papel   NOUN    <np-def>|N|M|S|@<ACC    Gender=Masc|Number=Sing 3   dobj    _   _
8   de  de  ADP PRP|@N< _   9   case    _   _
9   consultor   consultor   NOUN    <np-idf>|N|M|S|@P<  Gender=Masc|Number=Sing 7   nmod    _   _
10  encartado   encartar    VERB    <mv>|V|PCP|M|S|@ICL-N<  Gender=Masc|Number=Sing 9   acl _   _
11  .   .   PUNCT   PU|@PU  _   1   punct   _   _
livyreal commented 8 years ago

pouco can be a pronoun? @claudiafreitas , what do you think?

1   A   o   DET <artd>|ART|F|S|@>N  Gender=Fem|Number=Sing  2   det _   _
2   primeira    primeiro    ADJ <n>|<NUM-ord>|<np-def>|ADJ|F|S|@SUBJ>   Gender=Fem|Number=Sing  3   nsubj   _   _
3   fez fazer   VERB    <mv>|V|PS|3S|IND|@FS-STA    Mood=Ind|Tense=Past|Person=3|Number=Sing    0   root    _   _
4   dez dez NUM <card>|NUM|M|P|@>N  _   5   nummod  _   _
5   anos    ano NOUN    <np-def>|N|M|P|@<ACC    Gender=Masc|Number=Plur 3   dobj    _   _
6   há há ADP PRP|@<ADVL  _   7   case    _   _
7   pouco   pouco   PRON    <quant>|DET|M|S|@P< Gender=Masc|Number=Sing 3   nmod    _   _
8   .   .   PUNCT   PU|@PU  _   3   punct   _   
arademaker commented 7 years ago

another sentence that seems wrong is https://github.com/own-pt/bosque-UD/blob/a1d00790204cf68d5decb08ac880797607ef46f9/documents/CF103.conllu#L16

arademaker commented 7 years ago

Vide e5dfc60, CF51-2

livyreal commented 7 years ago

CF829-7, CP153-4 #113

livyreal commented 7 years ago

CP36-1, CP667-5, CF985-4, CF849-4 e CF103-1. #138

arademaker commented 7 years ago

Vide https://github.com/own-pt/bosque-UD/blob/master/documents/CF500.conllu#L1-L13 and

livyreal commented 7 years ago

reportado em #138 CP25-5

No caso do CP25-5 acho que está ERRADO. Lendo a documentação em http://universaldependencies.org/u/dep/cc.html parece que cc deveria ligar o coordenado à conjunção. Mas estamos ligando o tanto e como ao primeiro elemento coordenado partidos. Mas a direção destas setas sempre me confunde, mas acho que o head de 33 como deveria ser o token 36 Conselho. A propósito, também acho que a análise interna do nome Conselho de Fiscalização dos Serviços de Informações está errada. Fiscalização modifica o Conselho mas Serviços não modifica Conselho, modifica Fiscalização, não?

e

CP667-5 - tudo errado (verbo principal em elipse, o que deixar como ROOT?)

vcvpaiva commented 7 years ago

"bis" is NOUN, not interjection in this sentence

1 Enquanto enquanto ADV rel>|ADV|@ADVL 4 advmod 2 Gloria Gloria PROPN PROP|F|S|@SUBJ> Gender=Fem|Number=Sing 4 nsubj MWE=GloriaPires 3 Pires Pires PROPN PROP|@N< Number=Sing 2 name 4 ficou ficar VERB first-cjt>|<mv>|V|PS|3S|IND|@FS-ADVL Mood=Ind|Number=Sing|Person=3|Tense=Past|VerbForm=Fin 16 advcl 5 nervosa nervoso ADJ ADJ|F|S|@<SC Gender=Fem|Number=Sing 4 xcomp 6 em em ADP PRP|@<ADVL 8 case 7 sua seu DET |DET|F|S|@>N Gender=Fem|Number=Sing 8 det 8 estréia estréia NOUN |N|F|S|@P< Gender=Fem|Number=Sing 4 nmod 9 como como ADP |PRP|@N< 10 case 10 modette modette NOUN |N|F|S|@P< Gender=Fem|Number=Sing 8 nmod 11 , , PUNCT PU|@PU 4 punct 12 o o DET |ART|M|S|@>N Definite=Def|Gender=Masc|Number=Sing|PronType=Art 13 det 13 marido marido NOUN np-def>|N|M|S|@SUBJ Gender=Masc|Number=Sing 16 nsubj 14 Orlando Orlando PROPN PROP|M|S|@N< Gender=Masc|Number=Sing 13 appos _ MWE=OrlandoMoraes 15 Moraes Moraes PROPN PROP|@N< Number=Sing 14 name 16 amou amar VERB ||V|PS|3S|IND|@FS-STA Mood=Ind|Number=Sing|Person=3|Tense=Past|VerbForm=Fin 0 root 17 e e CONJ |KC|@CO 16 cc 18 pediu pedir VERB ||V|PS|3S|IND|@FS-STA Mood=Ind|Number=Sing|Person=3|Tense=Past|VerbForm=Fin 16 conj 19 bis bis INTJ IN|@<ACC 18 dobj 20 . . PUNCT PU|@PU 16 punct

vcvpaiva commented 7 years ago

"basta" is not interjection in

1 Religiosos religioso NOUN np-idf>|N|M|P|@SUBJ Gender=Masc|Number=Plur 3 nsubj 2 haitianos haitiano ADJ ADJ|M|P|@N< Gender=Masc|Number=Plur 1 amod 3 dizem dizer VERB |V|PR|3P|IND|@FS-STA Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin 0 root 4 basta basta INTJ IN|@<ACC 3 dobj _

vcvpaiva commented 7 years ago

"obrigada" is not interjection in this sentence, I think:

1   Folha   Folha   PROPN   PROP|F|S|@NPHR  Gender=Fem|Number=Sing  0   root    _   _
2   --  --  PUNCT   PU|@PU  _   1   punct   _   _
3   Obrigada    obrigado    INTJ    <first-cjt>|IN|F|S|@UTT Gender=Fem|Number=Sing  1   parataxis   _   _
4   por por ADP <sam->|PRP|@<ADVL   _   6   case    _   _
5   a   o   DET <-sam>|<artd>|ART|F|S|@>N   Definite=Def|Gender=Fem|Number=Sing|PronType=Art    6   det _   _
6   entrevista  entrevista  NOUN    <np-def>|N|F|S|@P<  Gender=Fem|Number=Sing  3   nmod    _   _
7   .   .   PUNCT   PU|@PU  _   1   punct   _   _
livyreal commented 7 years ago

CF380-3 arrumar a deprel de jornalistas (conj) CF442-2 nao tem remnant, mas tem elipse.

livyreal commented 7 years ago

text = É um pouco a versão de uma espécie de «outro lado da noite», a meio caminho entre os devaneios de uma fauna periférica, seja de Lisboa, Londres, Dublin ou Faro e Portimão, e a postura circunspecta dos fiéis da casa, que dela esperam a música «geracionista» dos 60 ou dos 70. sent_id = CP1-4

`Faro' is:

37 Faro faro NOUN n|M|S Gender=Masc|Number=Sing 31 conj _ _

and should be a proper noun:

37 Faro Faro PROPN _ Number=Sing 31 conj _ _

wellington36 commented 3 years ago

Neste issue temos o tratamento de sentenças problemáticas, como estamos tratando sentenças em issues separados, talvez seria interessante abrir issues para sentenças mencionadas aqui que não foram resolvidas e depois fechar este issue, não descartando a ideia de manter o tratamento de sentenças sozinhas num determinado issue, concorda @arademaker?.

arademaker commented 3 years ago

sim em geral, mas por outro lado, toda vez que corrigimos casos muito isolados, acabamos gerando inconsistências. Logo para este issue, acho que podemos simplesmente tentar fechar diretamente. Para os próximos casos, tentamos abrir issues específicos. e note que seria bom issues não do tipo "como analisar a sentença X", mas específicos sobre uma data construção duvidosa da sentença X que certamente deve aparecer em outras sentenças.

arademaker commented 3 years ago

podemos começar enumerando, a partir da leitura dos comentários acima, as ações concretas que precisamos fazer na forma de uma lista.

arademaker commented 3 years ago

another sentence that seems wrong is https://github.com/own-pt/bosque-UD/blob/a1d00790204cf68d5decb08ac880797607ef46f9/documents/CF103.conllu#L16

O que acha @leoalenc ?

CF103-1 Os «contratos de gaveta», vistos pela CPI como mais um indício de que as empreiteiras atuavam em cartel, são compromissos sigilosos entre as empresas.

─┮  
 │   ╭─╼ Os DET det 1 3  
 │   ├─╼ « PUNCT punct 2 3  
 │ ╭─┾ contratos NOUN nsubj 3 25  
 │ │ │ ╭─╼ de ADP case 4 5  
 │ │ ├─┶ gaveta NOUN nmod 5 3  
 │ │ ├─╼ » PUNCT punct 6 3  
 │ │ │ ╭─╼ , PUNCT punct 7 8  
 │ │ ╰─┾ vistos VERB acl 8 3  
 │ │   │ ╭─╼ por ADP case 9 11  
 │ │   │ ├─╼ a DET det 10 11  
 │ │   ├─┶ CPI PROPN obj 11 8  
 │ │   │ ╭─╼ como ADP case 12 15  
 │ │   │ │ ╭─╼ mais ADV advmod 13 14  
 │ │   │ ├─┶ um NUM nummod 14 15  
 │ │   ╰─┾ indício NOUN obl 15 8  
 │ │     │ ╭─╼ de SCONJ mark 16 20  
 │ │     │ ├─╼ que SCONJ mark 17 20  
 │ │     │ │ ╭─╼ as DET det 18 19  
 │ │     │ ├─┶ empreiteiras NOUN nsubj 19 20  
 │ │     ╰─┾ atuavam VERB acl 20 15  
 │ │       │ ╭─╼ em ADP case 21 22  
 │ │       ├─┶ cartel NOUN obl 22 20  
 │ │       ╰─╼ , PUNCT punct 23 20  
 │ ├─╼ são AUX cop 24 25  
 ╰─┾ compromissos NOUN root 25 0  
   ├─╼ sigilosos ADJ amod 26 25  
   │ ╭─╼ entre ADP case 27 29  
   │ ├─╼ as DET det 28 29  
   ├─┶ empresas NOUN nmod 29 25  
   ╰─╼ . PUNCT punct 30 25  
arademaker commented 3 years ago

a sério adv? id="5058" ref="CP984-4" source="CETEMPúblico n=984 sec=nd sem=94b" forest="1" text="Gosto de levar a sério o meu papel de consultor encartado."

Adotei ADJ para "sério" e advmod de levar

arademaker commented 3 years ago

pouco can be a pronoun? @claudiafreitas , what do you think?

1   A   o   DET <artd>|ART|F|S|@>N  Gender=Fem|Number=Sing  2   det _   _
2   primeira    primeiro    ADJ <n>|<NUM-ord>|<np-def>|ADJ|F|S|@SUBJ>   Gender=Fem|Number=Sing  3   nsubj   _   _
3   fez fazer   VERB    <mv>|V|PS|3S|IND|@FS-STA    Mood=Ind|Tense=Past|Person=3|Number=Sing    0   root    _   _
4   dez dez NUM <card>|NUM|M|P|@>N  _   5   nummod  _   _
5   anos    ano NOUN    <np-def>|N|M|P|@<ACC    Gender=Masc|Number=Plur 3   dobj    _   _
6   há há ADP PRP|@<ADVL  _   7   case    _   _
7   pouco   pouco   PRON    <quant>|DET|M|S|@P< Gender=Masc|Number=Sing 3   nmod    _   _
8   .   .   PUNCT   PU|@PU  _   3   punct   _   

Usei há/VERB e pouco como ADV.

arademaker commented 3 years ago

Vide e5dfc60, CF51-2

CF51-2 Não falei nada, mas visualizei a Sra. Oke, sentada no salão amarelo, o mesmo salão onde nenhum Oke de Okehurst exceto ela ousava permanecer sozinho, envergando o vestido de sua antepassada e confrontando-se, por assim dizer, com aquela coisa vaga, plangente, que parecia permear o aposento ... aquela vaga presença -- assim me parecia do galante poeta assassinado.


─┮  
│ ╭─╼ Não ADV advmod 1 2  
╰─┾ falei VERB root 2 0  
├─╼ nada PRON obj 3 2  
│ ╭─╼ , PUNCT punct 4 6  
│ ├─╼ mas CCONJ cc 5 6  
├─┾ visualizei VERB conj 6 2  
│ │ ╭─╼ a DET det 7 8  
│ ╰─┾ Sra. PROPN obj 8 6  
│   ├─╼ Oke PROPN appos 9 8  
│   │ ╭─╼ , PUNCT punct 10 11  
│   ╰─┾ sentada VERB acl 11 8  
│     │ ╭─╼ em ADP case 12 14  
│     │ ├─╼ o DET det 13 14  
│     ╰─┾ salão NOUN obl 14 11  
│       ├─╼ amarelo ADJ amod 15 14  
│       │ ╭─╼ , PUNCT punct 16 19  
│       │ ├─╼ o DET det 17 19  
│       │ ├─╼ mesmo ADJ amod 18 19  
│       ╰─┾ salão NOUN appos 19 14  
│         │ ╭─╼ onde ADV advmod 20 27  
│         │ │ ╭─╼ nenhum DET det 21 22  
│         │ ├─┾ Oke PROPN nsubj 22 27  
│         │ │ │ ╭─╼ de ADP case 23 24  
│         │ │ ╰─┶ Okehurst PROPN nmod 24 22  
│         │ │ ╭─╼ exceto ADP case 25 26  
│         │ ├─┶ ela PRON obl 26 27  
│         ╰─┾ ousava VERB acl:relcl 27 19  
│           ╰─┮ permanecer VERB xcomp 28 27  
│             ├─╼ sozinho ADJ xcomp 29 28  
│             │ ╭─╼ , PUNCT punct 30 31  
│             ╰─┾ envergando VERB advcl 31 28  
│               │ ╭─╼ o DET det 32 33  
│               ├─┾ vestido NOUN obj 33 31  
│               │ │ ╭─╼ de ADP case 34 36  
│               │ │ ├─╼ sua DET det 35 36  
│               │ ╰─┶ antepassada NOUN nmod 36 33  
│               │ ╭─╼ e CCONJ cc 37 38  
│               ╰─┾ confrontando VERB conj 38 31  
│                 ├─╼ se PRON expl 39 38  
│                 │ ╭─╼ , PUNCT punct 40 41  
│                 ├─┾ por SCONJ mark 41 38  
│                 │ ├─╼ assim ADV fixed 42 41  
│                 │ ├─╼ dizer VERB fixed 43 41  
│                 │ ╰─╼ , PUNCT punct 44 41  
│                 │ ╭─╼ com ADP case 45 47  
│                 │ ├─╼ aquela DET det 46 47  
│                 ├─┾ coisa NOUN obj 47 38  
│                 │ ├─╼ vaga ADJ amod 48 47  
│                 │ │ ╭─╼ , PUNCT punct 49 50  
│                 │ ├─┾ plangente ADJ amod 50 47  
│                 │ │ ╰─╼ , PUNCT punct 51 50  
│                 │ │ ╭─╼ que PRON nsubj 52 53  
│                 │ ╰─┾ parecia VERB acl:relcl 53 47  
│                 │   ╰─┮ permear VERB xcomp 54 53  
│                 │     │ ╭─╼ o DET det 55 56  
│                 │     ├─┶ aposento NOUN obj 56 54  
│                 │     ╰─╼ ... PUNCT punct 57 54  
│                 │ ╭─╼ aquela DET det 58 60  
│                 │ ├─╼ vaga ADJ amod 59 60  
│                 ╰─┾ presença NOUN nsubj 60 38  
│                   │ ╭─╼ -- PUNCT punct 61 64  
│                   │ ├─╼ assim ADV advmod 62 64  
│                   │ ├─╼ me PRON obj 63 64  
│                   ╰─┾ parecia VERB parataxis 64 60  
│                     │ ╭─╼ de ADP case 65 68  
│                     │ ├─╼ o DET det 66 68  
│                     │ ├─╼ galante ADJ amod 67 68  
│                     ╰─┾ poeta NOUN nsubj 68 64  
│                       ╰─╼ assassinado VERB acl 69 68  
╰─╼ . PUNCT punct 70 2  
arademaker commented 3 years ago

"obrigada" is not interjection in this sentence, I think:

1 Folha Folha PROPN PROP|F|S|@NPHR Gender=Fem|Number=Sing 0 root 2 -- -- PUNCT PU|@pu 1 punct 3 Obrigada obrigado INTJ |IN|F|S|@utt Gender=Fem|Number=Sing 1 parataxis 4 por por ADP |PRP|@<ADVL 6 case 5 a o DET <-sam>||ART|F|S|@>N Definite=Def|Gender=Fem|Number=Sing|PronType=Art 6 det 6 entrevista entrevista NOUN |N|F|S|@p< Gender=Fem|Number=Sing 3 nmod 7 . . PUNCT PU|@pu 1 punct _

estou usando ADJ para "obrigada". O que acha @leoalenc ?

arademaker commented 3 years ago

Nenhum dicionário que consultei licencia tanto como conjunção, embora pareça ser o papel de 'tanto... como' aqui. @leoalenc ?

CP25-5 Facto que, ao longo do tempo, foi repetidamente denunciado, tanto pelos partidos da oposição (onde se destacaram o PCP e o PS), como pelo Conselho de Fiscalização dos Serviços de Informações nomeado pela AR.

─┮  
 ╰─┮ Facto PROPN root 1 0  
   │ ╭─╼ que PRON nsubj:pass 2 13  
   │ │ ╭─╼ , PUNCT punct 3 6  
   │ │ ├─╼ a ADP case 4 6  
   │ │ ├─╼ o DET det 5 6  
   │ ├─┾ longo NOUN obl 6 13  
   │ │ │ ╭─╼ de ADP case 7 9  
   │ │ │ ├─╼ o DET det 8 9  
   │ │ ├─┶ tempo NOUN nmod 9 6  
   │ │ ╰─╼ , PUNCT punct 10 6  
   │ ├─╼ foi AUX aux:pass 11 13  
   │ ├─╼ repetidamente ADV advmod 12 13  
   ├─┾ denunciado VERB acl:relcl 13 1  
   │ ├─╼ , PUNCT punct 14 13  
   │ │ ╭─╼ tanto ADV cc 15 18  
   │ │ ├─╼ por ADP case 16 18  
   │ │ ├─╼ os DET det 17 18  
   │ ╰─┾ partidos NOUN obl:agent 18 13  
   │   │ ╭─╼ de ADP case 19 21  
   │   │ ├─╼ a DET det 20 21  
   │   ├─┶ oposição NOUN nmod 21 18  
   │   │ ╭─╼ ( PUNCT punct 22 25  
   │   │ ├─╼ onde PRON obl 23 25  
   │   │ ├─╼ se PRON expl 24 25  
   │   ├─┾ destacaram VERB acl:relcl 25 18  
   │   │ │ ╭─╼ o DET det 26 27  
   │   │ ├─┾ PCP PROPN nsubj 27 25  
   │   │ │ │ ╭─╼ e CCONJ cc 28 30  
   │   │ │ │ ├─╼ o DET det 29 30  
   │   │ │ ╰─┶ PS PROPN conj 30 27  
   │   │ ╰─╼ ) PUNCT punct 31 25  
   │   │ ╭─╼ , PUNCT punct 32 36  
   │   │ ├─╼ como CCONJ cc 33 36  
   │   │ ├─╼ por ADP case 34 36  
   │   │ ├─╼ o DET det 35 36  
   │   ╰─┾ Conselho PROPN conj 36 18  
   │     │ ╭─╼ de ADP case 37 38  
   │     ├─┾ Fiscalização PROPN nmod 38 36  
   │     │ │ ╭─╼ de ADP case 39 41  
   │     │ │ ├─╼ os DET det 40 41  
   │     │ ╰─┾ Serviços PROPN nmod 41 38  
   │     │   │ ╭─╼ de ADP case 42 43  
   │     │   ╰─┶ Informações PROPN nmod 43 41  
   │     ╰─┮ nomeado VERB acl 44 36  
   │       │ ╭─╼ por ADP case 45 47  
   │       │ ├─╼ a DET det 46 47  
   │       ╰─┶ AR PROPN obl:agent 47 44  
   ╰─╼ . PUNCT punct 48 1  
arademaker commented 3 years ago

com este ultimo commit, acho que o issue pode ser fechado. Vou esperar comentários @leoalenc apenas sobre minhas perguntas acima.

leoalenc commented 3 years ago

another sentence that seems wrong is https://github.com/own-pt/bosque-UD/blob/a1d00790204cf68d5decb08ac880797607ef46f9/documents/CF103.conllu#L16

O que acha @leoalenc ?

CF103-1 Os «contratos de gaveta», vistos pela CPI como mais um indício de que as empreiteiras atuavam em cartel, são compromissos sigilosos entre as empresas.

─┮  
 │   ╭─╼ Os DET det 1 3  
 │   ├─╼ « PUNCT punct 2 3  
 │ ╭─┾ contratos NOUN nsubj 3 25  
 │ │ │ ╭─╼ de ADP case 4 5  
 │ │ ├─┶ gaveta NOUN nmod 5 3  
 │ │ ├─╼ » PUNCT punct 6 3  
 │ │ │ ╭─╼ , PUNCT punct 7 8  
 │ │ ╰─┾ vistos VERB acl 8 3  
 │ │   │ ╭─╼ por ADP case 9 11  
 │ │   │ ├─╼ a DET det 10 11  
 │ │   ├─┶ CPI PROPN obj 11 8  
 │ │   │ ╭─╼ como ADP case 12 15  
 │ │   │ │ ╭─╼ mais ADV advmod 13 14  
 │ │   │ ├─┶ um NUM nummod 14 15  
 │ │   ╰─┾ indício NOUN obl 15 8  
 │ │     │ ╭─╼ de SCONJ mark 16 20  
 │ │     │ ├─╼ que SCONJ mark 17 20  
 │ │     │ │ ╭─╼ as DET det 18 19  
 │ │     │ ├─┶ empreiteiras NOUN nsubj 19 20  
 │ │     ╰─┾ atuavam VERB acl 20 15  
 │ │       │ ╭─╼ em ADP case 21 22  
 │ │       ├─┶ cartel NOUN obl 22 20  
 │ │       ╰─╼ , PUNCT punct 23 20  
 │ ├─╼ são AUX cop 24 25  
 ╰─┾ compromissos NOUN root 25 0  
   ├─╼ sigilosos ADJ amod 26 25  
   │ ╭─╼ entre ADP case 27 29  
   │ ├─╼ as DET det 28 29  
   ├─┶ empresas NOUN nmod 29 25  
   ╰─╼ . PUNCT punct 30 25  

@arademaker, indício não constitui obl de vistos, mas xcomp. Veja:

Os investigadores vêem os contratos de gaveta como indícios de fraude. Os investigadores consideram os contratos de gaveta indícios de fraude.

Não existe a preposição como em português. Veja: https://www.infopedia.pt/dicionarios/lingua-portuguesa/como

leoalenc commented 3 years ago

estou usando ADJ para "obrigada". O que acha @leoalenc ?

@arademaker, concordo com você.

leoalenc commented 3 years ago

Nenhum dicionário que consultei licencia tanto como conjunção, embora pareça ser o papel de 'tanto... como' aqui. @leoalenc ?

CP25-5 Facto que, ao longo do tempo, foi repetidamente denunciado, tanto pelos partidos da oposição (onde se destacaram o PCP e o PS), como pelo Conselho de Fiscalização dos Serviços de Informações nomeado pela AR.

─┮  
 ╰─┮ Facto PROPN root 1 0  
   │ ╭─╼ que PRON nsubj:pass 2 13  
   │ │ ╭─╼ , PUNCT punct 3 6  
   │ │ ├─╼ a ADP case 4 6  
   │ │ ├─╼ o DET det 5 6  
   │ ├─┾ longo NOUN obl 6 13  
   │ │ │ ╭─╼ de ADP case 7 9  
   │ │ │ ├─╼ o DET det 8 9  
   │ │ ├─┶ tempo NOUN nmod 9 6  
   │ │ ╰─╼ , PUNCT punct 10 6  
   │ ├─╼ foi AUX aux:pass 11 13  
   │ ├─╼ repetidamente ADV advmod 12 13  
   ├─┾ denunciado VERB acl:relcl 13 1  
   │ ├─╼ , PUNCT punct 14 13  
   │ │ ╭─╼ tanto ADV cc 15 18  
   │ │ ├─╼ por ADP case 16 18  
   │ │ ├─╼ os DET det 17 18  
   │ ╰─┾ partidos NOUN obl:agent 18 13  
   │   │ ╭─╼ de ADP case 19 21  
   │   │ ├─╼ a DET det 20 21  
   │   ├─┶ oposição NOUN nmod 21 18  
   │   │ ╭─╼ ( PUNCT punct 22 25  
   │   │ ├─╼ onde PRON obl 23 25  
   │   │ ├─╼ se PRON expl 24 25  
   │   ├─┾ destacaram VERB acl:relcl 25 18  
   │   │ │ ╭─╼ o DET det 26 27  
   │   │ ├─┾ PCP PROPN nsubj 27 25  
   │   │ │ │ ╭─╼ e CCONJ cc 28 30  
   │   │ │ │ ├─╼ o DET det 29 30  
   │   │ │ ╰─┶ PS PROPN conj 30 27  
   │   │ ╰─╼ ) PUNCT punct 31 25  
   │   │ ╭─╼ , PUNCT punct 32 36  
   │   │ ├─╼ como CCONJ cc 33 36  
   │   │ ├─╼ por ADP case 34 36  
   │   │ ├─╼ o DET det 35 36  
   │   ╰─┾ Conselho PROPN conj 36 18  
   │     │ ╭─╼ de ADP case 37 38  
   │     ├─┾ Fiscalização PROPN nmod 38 36  
   │     │ │ ╭─╼ de ADP case 39 41  
   │     │ │ ├─╼ os DET det 40 41  
   │     │ ╰─┾ Serviços PROPN nmod 41 38  
   │     │   │ ╭─╼ de ADP case 42 43  
   │     │   ╰─┶ Informações PROPN nmod 43 41  
   │     ╰─┮ nomeado VERB acl 44 36  
   │       │ ╭─╼ por ADP case 45 47  
   │       │ ├─╼ a DET det 46 47  
   │       ╰─┶ AR PROPN obl:agent 47 44  
   ╰─╼ . PUNCT punct 48 1  

@arademaker, considero tanto...como uma locução conjuncional. Há exemplos análogos na gramática de Cunha e Cintra. Os dicionários têm dificuldade de reconhecer determinadas expressões de múltiplas palavras como unidades que mereceriam um tratamento análogo ao que é dado a itens constituídos de uma única palavra. O excelente dicionário da Porto Editora, por exemplo, de fato não classifica explicitamente tanto como conjunção, mas lista, no verbete respectivo, uma série de locuções com esse item que correspondem a conjunções ou locuções conjuncionais:

tanto mais que além de que, já que [...] tanto quanto segundo, conforme, todo o que

arademaker commented 3 years ago

@arademaker, indício não constitui obl de vistos, mas xcomp. Veja:

Os investigadores vêem os contratos de gaveta como indícios de fraude. Os investigadores consideram os contratos de gaveta indícios de fraude.

Não existe a preposição como em português. Veja: https://www.infopedia.pt/dicionarios/lingua-portuguesa/como

(editando comentário) acredito que a analise de xcomp é licenciada aqui pelo mesmo motivo da discussão em #353. Mas se @leoalenc puder explicar melhor o contraste que pretende mostrar com os exemplos acima, agradeço. Temos agora:

CF103-1 Os «contratos de gaveta», vistos pela CPI como mais um indício de que as empreiteiras atuavam em cartel, são compromissos sigilosos entre as empresas.

─┮  
 │   ╭─╼ Os DET det 1 3  
 │   ├─╼ « PUNCT punct 2 3  
 │ ╭─┾ contratos NOUN nsubj 3 25  
 │ │ │ ╭─╼ de ADP case 4 5  
 │ │ ├─┶ gaveta NOUN nmod 5 3  
 │ │ ├─╼ » PUNCT punct 6 3  
 │ │ │ ╭─╼ , PUNCT punct 7 8  
 │ │ ╰─┾ vistos VERB acl 8 3  
 │ │   │ ╭─╼ por ADP case 9 11  
 │ │   │ ├─╼ a DET det 10 11  
 │ │   ├─┶ CPI PROPN obj 11 8  
 │ │   │ ╭─╼ como SCONJ mark 12 15  
 │ │   │ │ ╭─╼ mais ADV advmod 13 14  
 │ │   │ ├─┶ um NUM nummod 14 15  
 │ │   ├─┾ indício NOUN xcomp 15 8  
 │ │   │ │ ╭─╼ de SCONJ mark 16 20  
 │ │   │ │ ├─╼ que SCONJ mark 17 20  
 │ │   │ │ │ ╭─╼ as DET det 18 19  
 │ │   │ │ ├─┶ empreiteiras NOUN nsubj 19 20  
 │ │   │ ╰─┾ atuavam VERB acl 20 15  
 │ │   │   │ ╭─╼ em ADP case 21 22  
 │ │   │   ╰─┶ cartel NOUN obl 22 20  
 │ │   ╰─╼ , PUNCT punct 23 8  
 │ ├─╼ são AUX cop 24 25  
 ╰─┾ compromissos NOUN root 25 0  
   ├─╼ sigilosos ADJ amod 26 25  
   │ ╭─╼ entre ADP case 27 29  
   │ ├─╼ as DET det 28 29  
   ├─┶ empresas NOUN nmod 29 25  
   ╰─╼ . PUNCT punct 30 25  

Concorda @leoalenc ? Me questiono ainda se CPI é mesmo OBJ de vistos

arademaker commented 3 years ago

@arademaker, considero tanto...como uma locução conjuncional. Há exemplos análogos na gramática de Cunha e Cintra.

E alguma pista de como anotar locução conjunctional em UD? Se simplificarmos o caso em questão para [1], temos em [2] a tradução para EN:

  1. ele foi denunciado tanto pelos partidos como pelo conselho.
  2. he was denounced by both the parties and the council.

UDPipe me dá como analise (provavelmente por anotações similares no corpus EWT) uma construção de coordenação:

image