CompLin / nheengatu

Tools and resources for the computational processing of Nheengatu (Modern Tupi)
7 stars 1 forks source link

dúvida sobre disponibilidade de etiqueta especial para anotar todos os tokens de "São Gabriel da Cachoeira" #581

Closed juliana-gurgel closed 2 weeks ago

juliana-gurgel commented 2 weeks ago

Casasnovas2006:12:34:200 Casasnovas (2006, p. 100), sentença nº 39-40:

Iké, yané tawa upé, "São Gabriel da Cachoeira", panhẽ yandé yamandwari kwá kunhamukú puranga, sera waá ADANA. Nesta nossa cidade de São Gabriel da Cachoeira, continua viva a lembrança de ADANA, A MAIS BELA MOÇA DO RIO NEGRO.

@leoalenc, o Yauti não anota todos os tokens de São Gabriel da Cachoeira, como vemos na imagem a seguir:

image

Existe alguma etiqueta especial (como /n@) que posso utilizar na inputline para fazer a anotação automática das XPOS e das DEPREL desses tokens?

Com base na sentença Navarro2016:0:0:56, eu anotaria todos os tokens como PROPN, com appos na DEPREL de São e flat nas DEPREL dos demais tokens. Seria correto anotar assim?

leoalenc commented 2 weeks ago

Casasnovas2006:12:34:200 Casasnovas (2006, p. 100), sentença nº 39-40:

Iké, yané tawa upé, "São Gabriel da Cachoeira", panhẽ yandé yamandwari kwá kunhamukú puranga, sera waá ADANA. Nesta nossa cidade de São Gabriel da Cachoeira, continua viva a lembrança de ADANA, A MAIS BELA MOÇA DO RIO NEGRO.

@leoalenc, o Yauti não anota todos os tokens de São Gabriel da Cachoeira, como vemos na imagem a seguir:

image

Existe alguma etiqueta especial (como /n@) que posso utilizar na inputline para fazer a anotação automática das XPOS e das DEPREL desses tokens?

Com base na sentença Navarro2016:0:0:56, eu anotaria todos os tokens como PROPN, com appos na DEPREL de São e flat nas DEPREL dos demais tokens. Seria correto anotar assim?

@juliana-gurgel , obrigado pela oportuna pergunta. Já foi mostrado em issues anteriores como anotar nomes próprios que não estão no glossário nem em lugar nenhum do conjunto de ferramentas e recursos que compõem o Yauti, por exemplo, neste comentário do @heliolbs numa issue na qual você figura como assigned:

https://github.com/CompLin/nheengatu/issues/512#issuecomment-2336845406

Isso evidencia a necessidade de acompanhar as issues. Você também pode usar a eficiente ferramenta de busca do GitHub para encontrar issues abertas ou fechadas sobre uma determinada palavra-chave. Sobre a deprel, é isso mesmo, conforme a documentação de UD:

https://universaldependencies.org/u/dep/flat.html

O Yauti ainda não consegue anotar todas as deprels e heads corretamente nesse caso. Apenas upos e xpos etc.

leoalenc commented 2 weeks ago

@juliana-gurgel , também tratei da etiqueta especial para nomes próprios em #552.

juliana-gurgel commented 2 weeks ago

@juliana-gurgel , obrigado pela oportuna pergunta. Já foi mostrado em issues anteriores como anotar nomes próprios que não estão no glossário nem em lugar nenhum do conjunto de ferramentas e recursos que compõem o Yauti, por exemplo, neste comentário do @heliolbs numa issue na qual você figura como assigned:

Professor @leoalenc, eu deveria ter dito que estou familiarizada com a anotação de nomes próprios utilizando /=p, graças à issue #512, e que tenho utilizado bastante esse comando. A dúvida mesmo, que não ficou clara, era se existia uma maneira de atribuir as etiquetas morfossintáticas e a DEPREL ao mesmo tempo. Também tenho utilizado bastante a ferramenta de busca do GitHub e consultado o treebank antes de abrir as issues.

Mesmo assim, muito obrigada pelas orientações, professor!

leoalenc commented 2 weeks ago

@juliana-gurgel , obrigado pela oportuna pergunta. Já foi mostrado em issues anteriores como anotar nomes próprios que não estão no glossário nem em lugar nenhum do conjunto de ferramentas e recursos que compõem o Yauti, por exemplo, neste comentário do @heliolbs numa issue na qual você figura como assigned:

Professor @leoalenc, eu deveria ter dito que estou familiarizada com a anotação de nomes próprios utilizando /=p, graças à issue #512, e que tenho utilizado bastante esse comando. A dúvida mesmo, que não ficou clara, era se existia uma maneira de atribuir as etiquetas morfossintáticas e a DEPREL ao mesmo tempo. Também tenho utilizado bastante a ferramenta de busca do GitHub e consultado o treebank antes de abrir as issues.

Mesmo assim, muito obrigada pelas orientações, professor!

@juliana-gurgel , depois, quando vi suas outras issues de hoje, acabei entendendo, mas era tarde. Você pode usar /=p com todos os elementos de São Gabriel da Cachoeira, um por um. Ou talvez pudesse usar São/=adj:o|pt Gabriel/=p da/=upos:x|prep:o|pt Cachoeira/=n:o|pt, mas vi aqui que no momento o Yauti analisa automaticamente São como PROPN e não quebra da em de e a (afinal, isso é do português). Então acho que a primeira solução é viável à luz de UD.