Closed leoalenc closed 2 years ago
Pelo menos um lema tem sinal de pontuação:
muíri? (pron. interr.) - quanto (a)? quantos (as)?
Várias entradas apresentam problemas de formatação ou falta de informações:
Falta de hífen separando classe de palavra da glosa
apekatú (adv.) longe; (adj.) - distante
Falta de classe de palavra
mũ - irmão (de h.)
Este sintagma nominal que aparentemente constitui multiword expression tem entrada própria:
piripanasawa ruka (s.) - loja (lit., casa de compras)
A construção análoga do exemplo abaixo, contudo, não tem entrada própria:
mbuesawa (s.) - lição; ensinamento; explicação ● mbuesawa ruka (s.) - escola
Ver #38.
Separação de variantes por meio de ponto e vírgula:
tukano; tukanu (s.) - nome de grupo étnico e de língua do rio Negro
Forma com prefixo de relação sem parênteses, separada por vírgula:
rakú, sakú (se) (adj. 2ª cl.) - quente
Depois de sucessivos commits, muitos referentes a issues derivadas desta, podemos considerar a tarefa de extração de entradas como concluída, faltando verificar a cobertura do etiquetador sobre as entradas do glossário.
Estrutura das entradas do glossário de Navarro (2016)
Classes de palavras diferentes
Mesma classe de palavra
Indicação de registro desusado (desus.)
Indicação da valência verbal