Open leoalenc opened 3 years ago
@arademaker, expandi neste arquivo as abreviaturas usadas para compor os nomes dos tipos: names.txt
Alguns dos nomes são herdados da Matriz Gramatical, acho que, destes, todos integram nomes de tipos definidos em matrix.tdl.
Extraí os componentes dos nomes por meio do comando:
awk '$2 ~ /:=/ {print $3}' lexicon.tdl | tr "\-" "\n" | sort | uniq > names.txt
@arademaker, complementando a explicação sobre o arquivo anexado acima, os itens da coluna 1 que não têm correspondente na coluna 2 não são abreviaturas. Muitos desses itens são palavras do léxico, por exemplo, ir
é o verbo ir etc.
Sobre a terminologia, ver, por exemplo:
Sobre a distinção entre os diferentes tipos de demonstrativos, ver:
https://en.wikipedia.org/wiki/Demonstrative
Essas distinções estão codificadas nos tipos:
dem-prox-determiner-lex
dem-med-determiner-lex
dem-dist-determiner-lex
@arademaker, uma forma de documentar automaticamente os tipos de verbos é aplicar a gramática no conjunto de teste, produzindo, por exemplo, algo do tipo:
o cachorro quer:vol-verb-lex que o gato lata
o cachorro continua:ger-aux-lex querendo:bare-inf-aux-lex perseguir:trans-verb-lex o gato
I
@arademaker, uma forma de documentar automaticamente os tipos de verbos é aplicar a gramática no conjunto de teste, produzindo, por exemplo, algo do tipo:
o cachorro quer:vol-verb-lex que o gato lata
o cachorro continua:ger-aux-lex querendo:bare-inf-aux-lex perseguir:trans-verb-lex o gato
I
@arademaker, algo mais ousado é melhorar a visualização da hierarquia que é gerada pela Matriz.
Esta issue relaciona-se com o comentário de @arademaker: https://github.com/LR-POR/PorGram/issues/68#issuecomment-1024587709 assim como com #56 e #58.
@arademaker, obrigado pelas dicas, altamente relevantes. fac é facultative. Vou criar documento com definição da sintaxe utilizada nos nomes e uma tabela explicando todos os elementos que entram nos nomes dos tipos.
Não tem mesmo.
Originally posted by @leoalenc in https://github.com/LR-POR/PorGram/issues/18#issuecomment-897860741