CompLin / nheengatu

Tools and resources for the computational processing of Nheengatu (Modern Tupi)
7 stars 2 forks source link

manter "kitika" e "suruka" como adjetivos? #70

Open leoalenc opened 2 years ago

leoalenc commented 2 years ago

Os exemplos de #69 sugerem que o nheengatu não gramaticaliza a oposição entre infinitivo e particípio. Em vez disso, distingue entre formas finitas, marcadas com os prefixos flexionais de número e pessoa, e formas não-finitas. Desse modo, os paradigmas de witá e kitika, por exemplo, devem incluir as seguintes formas:

witá witá+V+NFIN kitika kitika+V+NFIN

Sobre a etiqueta NFIN:

https://en.wikipedia.org/wiki/List_of_glossing_abbreviations

No glossário e léxico, temos atualmente:

awk '$2 ~ /^kitika\+/' lexicon.txt

kitika kitika+A yakitika kitika+V+1+PL akitika kitika+V+1+SG pekitika kitika+V+2+PL rekitika kitika+V+2+SG ukitika kitika+V+3 taukitika kitika+V+3+PL takitika kitika+V+3+PL

grep -Ew "^kitika" glossary.txt

kitika (v.) - ralar kitika (adj.) - ralado

Originally posted by @leoalenc in https://github.com/CompLin/nheengatu/issues/69#issuecomment-1146619778

leoalenc commented 1 day ago
grep -E suruka glossary.txt

suruka (adj.) - rasgado suruka (v.) - rasgar-se

# sent_id = Navarro2016:3:16:105
# text = I xirura-itá suruka.
# text_eng = His pants are ripped.
# text_por = As calças dele estão rasgadas.
# text_source = Lesson 3, p. 21
# text_annotator = DMA
# reviewer1 = VAN
# reviewer2 = LFdeA
1   I   i   PRON    PRON2   Case=Gen|Number=Sing|Person=3|Poss=Yes|PronType=Prs 2   nmod:poss   _   TokenRange=0:1
2   xirura-itá  xirura  NOUN    N   Number=Plur 3   nsubj   _   TokenRange=2:12
3   suruka  suruka  VERB    V   VerbForm=Inf    0   root    _   SpaceAfter=No|TokenRange=13:19
4   .   .   PUNCT   PUNCT   _   3   punct   _   SpaceAfter=No|TokenRange=19:20
leoalenc commented 1 day ago

Alguns outros exemplos análogos no treebank. Relaciona-se com #282.