CompLin / nheengatu

Tools and resources for the computational processing of Nheengatu (Modern Tupi)
7 stars 2 forks source link

extração das entradas do glossário de Navarro (2016) #11

Closed leoalenc closed 2 years ago

leoalenc commented 2 years ago

Estrutura das entradas do glossário de Navarro (2016)

  1. Estrutura típica:

amaniú (s.) - algodão ambira (s. / adj.) - finado, falecido amú (pron. indef.) - outro, -a

  1. Variantes com classes diferentes numa mesma entrada:

apekatú (adv.) longe; (adj.) - distante apigawa (s.) - homem; (adj.) - macho

  1. Adjetivos de segunda classe (verbos estativos flexionáveis):

apara (se) (adj. 2ª cl.) - 1. torto; 2. camboto, de pernas tortas

  1. Substantivos com prefixos relacionais:
  1. Posposições e adjetivos com prefixos relacionais:

ruakí (suakí) (posp.) - perto de, próximo de ruakiwara (suakiwara) (adj.) - próximo, vizinho

  1. Adjetivos de segunda classe (verbos estativos flexionáveis) com prefixos relacionais:

rurí (surí) (se) (adj. 2ª cl.) - alegre, feliz

  1. Formas de palavras com prefixos relacionais:

rupiá - v. supiá

  1. Formas alternantes (alomorfes ou sinonímicas) numa mesma entrada:

yúri / uri (v.) - vir mukũipú (ou pu pu) (num.) - dez

  1. Entradas homonímicas (com índice sobrescrito):

yumbué 1 (v.) - aprender yumbué 2 (v.) - rezar

  1. Morfemas presos:

a- morf. núm.-pess. de 1ª pess. sing.

-usú - suf. de aumentativo: -ão, -ona; grande

  1. Alomorfes de palavras com entrada própria:

ã - v. ana

  1. Compostos e derivados do verbete:

yawara (s.) - cão ● yawara-kunhã - cadela

  1. Indicação de registro desusado (desus.)

    • na glosa

      yepé 2 (conj.) - embora, apesar de (desus.) yepé 3 (num.) - um(a); yepé yepé - um por um, um a um

    • junto com a classe de palavra

      yepé 4 (part. desus.) - expressa o pret. imperfeito

  2. Indicação da valência verbal

aikwé (v. impess.) - há, existe(m) mupaka (v. tr.) - acordar; fazer acordar

leoalenc commented 2 years ago

Pelo menos um lema tem sinal de pontuação:

muíri? (pron. interr.) - quanto (a)? quantos (as)?

leoalenc commented 2 years ago

Várias entradas apresentam problemas de formatação ou falta de informações:

leoalenc commented 2 years ago

Este sintagma nominal que aparentemente constitui multiword expression tem entrada própria:

piripanasawa ruka (s.) - loja (lit., casa de compras)

A construção análoga do exemplo abaixo, contudo, não tem entrada própria:

mbuesawa (s.) - lição; ensinamento; explicação ● mbuesawa ruka (s.) - escola

Ver #38.

leoalenc commented 2 years ago

Separação de variantes por meio de ponto e vírgula:

tukano; tukanu (s.) - nome de grupo étnico e de língua do rio Negro

leoalenc commented 2 years ago

Forma com prefixo de relação sem parênteses, separada por vírgula:

rakú, sakú (se) (adj. 2ª cl.) - quente

leoalenc commented 2 years ago

Depois de sucessivos commits, muitos referentes a issues derivadas desta, podemos considerar a tarefa de extração de entradas como concluída, faltando verificar a cobertura do etiquetador sobre as entradas do glossário.