Open leoalenc opened 2 years ago
grep -E suruka glossary.txt
suruka (adj.) - rasgado suruka (v.) - rasgar-se
# sent_id = Navarro2016:3:16:105
# text = I xirura-itá suruka.
# text_eng = His pants are ripped.
# text_por = As calças dele estão rasgadas.
# text_source = Lesson 3, p. 21
# text_annotator = DMA
# reviewer1 = VAN
# reviewer2 = LFdeA
1 I i PRON PRON2 Case=Gen|Number=Sing|Person=3|Poss=Yes|PronType=Prs 2 nmod:poss _ TokenRange=0:1
2 xirura-itá xirura NOUN N Number=Plur 3 nsubj _ TokenRange=2:12
3 suruka suruka VERB V VerbForm=Inf 0 root _ SpaceAfter=No|TokenRange=13:19
4 . . PUNCT PUNCT _ 3 punct _ SpaceAfter=No|TokenRange=19:20
Alguns outros exemplos análogos no treebank. Relaciona-se com #282.
Os exemplos de #69 sugerem que o nheengatu não gramaticaliza a oposição entre infinitivo e particípio. Em vez disso, distingue entre formas finitas, marcadas com os prefixos flexionais de número e pessoa, e formas não-finitas. Desse modo, os paradigmas de witá e kitika, por exemplo, devem incluir as seguintes formas:
Sobre a etiqueta
NFIN
:https://en.wikipedia.org/wiki/List_of_glossing_abbreviations
No glossário e léxico, temos atualmente:
awk '$2 ~ /^kitika\+/' lexicon.txt
grep -Ew "^kitika" glossary.txt
Originally posted by @leoalenc in https://github.com/CompLin/nheengatu/issues/69#issuecomment-1146619778