UniversalDependencies / UD_Portuguese-Bosque

This Universal Dependencies (UD) Portuguese treebank.
Other
48 stars 11 forks source link

incorrect attachment of PP #400

Closed leoalenc closed 1 year ago

leoalenc commented 2 years ago

@arademaker, revisando a amostra aleatória de entradas da PorGram geradas automaticamente, conforme https://github.com/LR-POR/PorGram/issues/66, deparei-me com o seguinte erro:

text = A administração sempre foi bastante conservadora nas suas aplicações de capital, que se traduzem principalmente por investimentos no sector do petróleo e pela gestão de uma carteira de títulos no valor de dois biliões de dólares nos Estados Unidos, composta por acções e obrigações.

sent_id = CP295-3
source = CETEMPúblico n=295 sec=clt sem=96a
1   A   o   DET _   Definite=Def|Gender=Fem|Number=Sing|PronType=Art    2   det _   _
2   administração   administração   NOUN    _   Gender=Fem|Number=Sing  6   nsubj   _   _
3   sempre  sempre  ADV _   _   6   advmod  _   _
4   foi ser AUX _   Mood=Ind|Number=Sing|Person=3|Tense=Past|VerbForm=Fin   6   cop _   _
5   bastante    bastante    ADV _   _   6   advmod  _   _
6   conservadora    conservador ADJ _   Gender=Fem|Number=Sing  0   root    _   _
7-8 nas _   _   _   _   _   _   _   _
7   em  em  ADP _   _   10  case    _   _
8   as  o   DET _   Definite=Def|Gender=Fem|Number=Plur|PronType=Art    10  det _   _
9   suas    seu DET _   Gender=Fem|Number=Plur|PronType=Prs 10  det _   _
10  aplicações  aplicação   NOUN    _   Gender=Fem|Number=Plur  6   obl _   _
11  de  de  ADP _   _   12  case    _   _
12  capital capital NOUN    _   Gender=Masc|Number=Sing 10  nmod    _   SpaceAfter=No
13  ,   ,   PUNCT   _   _   16  punct   _   _
14  que que PRON    _   Gender=Fem|Number=Plur|PronType=Rel 16  nsubj   _   _
15  se  se  PRON    _   Case=Acc|Gender=Fem|Number=Plur|Person=3|PronType=Prs   16  expl    _   _
16  traduzem    traduzir    VERB    _   Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin   10  acl:relcl   _   _
17  principalmente  principalmente  ADV _   _   16  advmod  _   _
18  por por ADP _   _   19  case    _   _
19  investimentos   investimento    NOUN    _   Gender=Masc|Number=Plur 17  obj _   _
20-21   no  _   _   _   _   _   _   _   _
20  em  em  ADP _   _   22  case    _   _
21  o   o   DET _   Definite=Def|Gender=Masc|Number=Sing|PronType=Art   22  det _   _
22  sector  sector  NOUN    _   Gender=Masc|Number=Sing 19  nmod    _   _
[...]

http://match.grew.fr/data/61e9ceb2a5477/4735.svg

O PP por investimentos aparece como obj do advérbio principalmente, quando, na verdade, deveria estar ligado ao verbo pronominal traduzir-se. Ver:

http://143.107.183.175:12680/verbobrasil/textoFrames/traduzir-v.html

Para o verbo pronominal traduzir-se, o Verbo-Brasil apresenta apenas exemplo do Arg2 realizado como PP introduzido por em, mas o dicionário do Borba contempla também um PP introduzido por como complemento da variante pronominal, parafraseada como "manifestar-se, revelar-se".

leoalenc commented 2 years ago

@arademaker , uma outra questão suscitada pelo exemplo acima é que principalmente parece modificar o PP que constitui objeto do verbo pronominal, não o próprio verbo.

arademaker commented 1 year ago

como iriamos marcar um ADV modificando o head da PP, neste caso investimentos? Em cb797de8f, corrigi o problema principal, se tiver uma idéia de como fazer o ADV modificar o NOUN, podemos reabrir este issue.

Em tempo, eu percebo principalmente modificando o verbo traduzir...