CompLin / nheengatu

Tools and resources for the computational processing of Nheengatu (Modern Tupi)
7 stars 1 forks source link

`parataxis` ou `advcl` em `Casasnovas2006:3:8:32`? #483

Open leoalenc opened 2 months ago

leoalenc commented 2 months ago

Em nheengatu, frequentemente dois ou mais verbos plenos (ou seja, verbos não classificados como auxiliares no glossary.json) se combinam sem nenhuma marca de subordinação, ou seja, um dos verbos governando mark, ou sinal de pontuação. Comparem-se as duas propostas de anotação para Casasnovas2006:3:8:32:

Versão atual

# sent_id = Casasnovas2006:3:8:32 # text = Aape, paá, siía mira-itá tayatiri tamaã. # text_adapter = JLG # text_orig = Aápe, paá, siía miraitá tayatiri tamã. # text_eng_ggl = A lot of people went to see it. # text_por_orig = Muita gente foi ver. # text_orig_transcriber = JLG # text_por_orig_transcriber = JLG # text_source = p. 73, No. 11 # title_orig = Pirayawara mira # title_por_orig = Homem boto # title_eng = Boto man # text_annotator = JLG # aknowledgement = DACILAT Project, FAPESP's Process No. 2022/09158-5 # reviewer1 = LFdeA

1   Aape    aape    ADV ADVT    AdvType=Tim 7   advmod  _   SpaceAfter=No|TokenRange=0:4
2   ,   ,   PUNCT   PUNCT   _   3   punct   _   TokenRange=4:5
3   paá paá PART    RPRT    Evident=Nfh|PartType=Mod    7   advmod  _   SpaceAfter=No|TokenRange=6:9
4   ,   ,   PUNCT   PUNCT   _   3   punct   _   TokenRange=9:10
5   siía    siía    DET INDQ    PronType=Ind    6   det _   TokenRange=11:15
6   mira-itá    mira    NOUN    N   Number=Plur 7   nsubj   _   TokenRange=16:24
7   tayatiri    yatiri  VERB    V   Number=Plur|Person=3|VerbForm=Fin   0   root    _   TokenRange=25:33
8   tamaã   maã VERB    V   Number=Plur|Person=3|VerbForm=Fin   7   parataxis   _   SpaceAfter=No|TokenRange=34:39
9   .   .   PUNCT   PUNCT   _   7   punct   _   SpaceAfter=No|TokenRange=39:40

Proposta inicial deste commit:

1   Aape    aape    ADV ADVJ    AdvType=Cau 7   advmod  _   SpaceAfter=No|TokenRange=0:4
2   ,   ,   PUNCT   PUNCT   _   3   punct   _   TokenRange=4:5
3   paá paá PART    RPRT    Evident=Nfh|PartType=Mod    7   advmod  _   SpaceAfter=No|TokenRange=6:9
4   ,   ,   PUNCT   PUNCT   _   3   punct   _   TokenRange=9:10
5   siía    siía    DET INDQ    PronType=Ind    6   det _   TokenRange=11:15
6   mira-itá    mira    NOUN    N   Number=Plur 7   nsubj   _   TokenRange=16:24
7   tayatiri    yatiri  VERB    V   Number=Plur|Person=3|VerbForm=Fin   0   root    _   TokenRange=25:33
8   tamaã   maã VERB    V   Number=Plur|Person=3|VerbForm=Fin   7   advcl   _   SpaceAfter=No|TokenRange=34:39
9   .   .   PUNCT   PUNCT   _   7   punct   _   SpaceAfter=No|TokenRange=39:40 

Observe que na tradução em português do próprio Casasnovas (2006) não ocorre mark. Essa tradução, contudo, não parece refletir inteiramente a estrutura do texto em nheengatu, onde temos a justaposição dos verbos yatiri 'reunir' (ou 'juntar' ) e maã 'ver'.

A proposta desta issue é decidir sobre a melhor anotação para casos como este, definindo critérios claros para anotação ou revisão de sentenças análogas. Acredito que há muitos exemplos deste tipo no treebank com anotações provavelmente díspares.

leoalenc commented 2 months ago

@heliolbs , @dominickmaia e @juliana-gurgel, várias outras issues levantam dúvidas parecidas envolvendo parataxis: #269, #308 e #399.

leoalenc commented 2 months ago

Um exemplo análogo: Casasnovas2006:3:9:33.

leoalenc commented 1 month ago

No caso de Casasnovas2006:8:4:72, @juliana-gurgel , o verbo purungitá não se liga ao primeiro verbo porque rege SCONJ, que assinala advcl.

leoalenc commented 1 month ago

@juliana-gurgel, relaciona-se com #599 e #308 e #515 .

juliana-gurgel commented 2 weeks ago
  • [ ] parataxis ou advcl em Casasnovas2006:3:8:32?

Professor @leoalenc, de acordo com a documentação de advcl é importante ressaltar o seguinte (grifo meu):

An adverbial clause modifier is a clause which modifies a verb or other predicate (adjective, etc.), as a modifier not as a core complement. This includes things such as a temporal clause, consequence, conditional clause, purpose clause, etc.

Esta issue propõe a definição de critérios claros para a anotação de casos como o de Casasnovas2006:3:8:32. Ao observar o verbo tamaã nesta sentença, ele não parece operar de maneira independente, o que exclui a possibilidade de parataxis. Pelo contrário, tamaã fornece informações adicionais sobre o verbo principal tayatiri, e essa relação sugere finalidade (reunir para ver), um caso típico de advcl ("purpose clause").

Um critério relevante para distinguir entre advcl e parataxis seria identificar se o verbo fornece informações complementares ou adverbiais sobre o verbo regente, como é o caso de tamaã em relação a tayatiri.

Essa abordagem parece apropriada para a anotação de construções semelhantes, professor @leoalenc?