CompLin / nheengatu

Tools and resources for the computational processing of Nheengatu (Modern Tupi)
7 stars 1 forks source link

"mayawé": `ADV` ou `SCONJ`? #477

Open leoalenc opened 1 month ago

leoalenc commented 1 month ago

@leoalenc, minha revisão da sentença Amorim1928:18:29-30:29-30 se encontra neste commit. Minha sugestão de solução para esse erro de multi-obj é mais complexa que qualquer uma das 14 sentenças anteriores e envolve muitos passos. São seis alterações relacionadas ao erro e uma sétima não relacionada (mudança da head da única parataxe da sentença). Reproduzo abaixo o detalhamento das sete alterações registradas na descrição do commit. Seguem também duas capturas de tela, da anotação e da revisão, respectivamente, para ilustrar as alterações propostas:

  • eliminação do obj do nó 5 Remaã;
  • atribuição de nsubj ao nó 7 tuwí com o nó 10 uyumuaíwa como head;
  • substituição de nmod:poss por amod como deprel do nó 7 tuwí;
  • inversão da direção da deprel amod atribuindo ao nó 7 tuwí o papel de head;
  • substituição de NOUN e N por ADJ e A como upos e xpos do nó 7 kwera;
  • substituição de advmod por mark como deprel do nó 9 mayawé; e
  • substituição o nó 10 uyumuaíwa pelo nó 5 Remaã como head da única parataxe da sentença.

image ✔️image

Originally posted by @heliolbs in https://github.com/CompLin/nheengatu/issues/460#issuecomment-2269303567

leoalenc commented 1 month ago

@heliolbs , parece que temos nesse caso algo como análogo ao discurso indireto, com o encaixamento de uma espécie de pergunta como complemento do verbo maã 'ver'. Veja:

# generator = UDPipe 2, https://lindat.mff.cuni.cz/services/udpipe # udpipe_model = english-ewt-ud-2.12-230717 # udpipe_model_licence = CC BY-NC-SA # newdoc # newpar # sent_id = 1 # text = See how your blood has spoiled.

1   See see VERB    VB  Mood=Imp|VerbForm=Fin   0   root    _   TokenRange=0:3
2   how how ADV WRB PronType=Int    6   advmod  _   TokenRange=4:7
3   your    your    PRON    PRP$    Case=Gen|Person=2|Poss=Yes|PronType=Prs 4   nmod:poss   _   TokenRange=8:12
4   blood   blood   NOUN    NN  Number=Sing 6   nsubj   _   TokenRange=13:18
5   has have    AUX VBZ Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin   6   aux _   TokenRange=19:22
6   spoiled spoil   VERB    VBN Tense=Past|VerbForm=Part    1   ccomp   _   SpaceAfter=No|TokenRange=23:30
7   .   .   PUNCT   .   _   1   punct   _   SpaceAfter=No|TokenRange=30:31

A análise por meio deste outro modelo difere, considerando how como advérbio relativo em vez de interrogativo como no exemplo anterior:

# generator = UDPipe 2, https://lindat.mff.cuni.cz/services/udpipe # udpipe_model = english-gum-ud-2.12-230717 # udpipe_model_licence = CC BY-NC-SA # newdoc # newpar # sent_id = 1 # text = See how your blood has spoiled.

1   See see VERB    VB  Mood=Imp|Person=2|VerbForm=Fin  0   root    _   TokenRange=0:3
2   how how ADV WRB PronType=Rel    1   obj _   TokenRange=4:7
3   your    your    PRON    PRP$    Case=Gen|Number=Sing|Person=2|Poss=Yes|PronType=Prs 4   nmod:poss   _   TokenRange=8:12
4   blood   blood   NOUN    NN  Number=Sing 6   nsubj   _   TokenRange=13:18
5   has have    AUX VBZ Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin   6   aux _   TokenRange=19:22
6   spoiled spoil   VERB    VBN Tense=Past|VerbForm=Part    2   advcl:relcl _   SpaceAfter=No|TokenRange=23:30
7   .   .   PUNCT   .   _   1   punct   _   SpaceAfter=No|TokenRange=30:31
leoalenc commented 1 month ago

https://universaldependencies.org/en/dep/advcl-relcl.html

A distinção entre as duas leituras de how etc. é difícil, conforme a documentação de UD:

Free relatives are subtly different from interrogative clauses, where the WH-word making it interrogative is inside the clause. Verbs such as wonder, know, and tell license interrogative complement clauses (including ones beginning with whether). With verbs like know and tell that license either a complement clauses or a direct object, disambiguating between the two types of WH-complements can be difficult.