LR-POR / PorGram

A Portuguese HPSG Grammar
Other
2 stars 1 forks source link

explaining the names of types #38

Open leoalenc opened 3 years ago

leoalenc commented 3 years ago

Na gramatica ERG, temos vários problemas com os nomes de tipos. Nem sempre o significado é claro. Seria bom termos, logo de inicio, uma boa documentação sobre os 'nomes' que usamos. Por exemplo, o que seria o prefixo fac em fac-refl-intrans?

@arademaker, obrigado pelas dicas, altamente relevantes. fac é facultative. Vou criar documento com definição da sintaxe utilizada nos nomes e uma tabela explicando todos os elementos que entram nos nomes dos tipos.

A ferramenta do @fcbond que permite navegar por uma gramática e treebank, exibe entradas como http://compling.hss.ntu.edu.sg/ltdb/cgi/ERG_1214//showtype.cgi?typ=aj_-_i-att-pn_le produzidas a partir da leitura dos arquivos TDL que seguem: 1) uma convenção de nomes para entradas lexicais e tipos (vide https://github.com/delph-in/docs/wiki/ErgLeTypes) e usam docstrings (parecidas com do Python):

aj_-_i-att_le := reg_adj_word &
"""
Adj, attributive                 
<ex>The inner ring is small.
"""
  [ SYNSEM basic_attr_adj_synsem ].

Um investimento interessante. Infelizmente acho que a MATRIX não tem nenhum suporte para estas documentações.

Não tem mesmo.

Originally posted by @leoalenc in https://github.com/LR-POR/PorGram/issues/18#issuecomment-897860741

leoalenc commented 3 years ago

@arademaker, expandi neste arquivo as abreviaturas usadas para compor os nomes dos tipos: names.txt

Alguns dos nomes são herdados da Matriz Gramatical, acho que, destes, todos integram nomes de tipos definidos em matrix.tdl.

Extraí os componentes dos nomes por meio do comando:

awk '$2 ~ /:=/ {print $3}' lexicon.tdl | tr "\-" "\n" | sort | uniq > names.txt

leoalenc commented 3 years ago

@arademaker, complementando a explicação sobre o arquivo anexado acima, os itens da coluna 1 que não têm correspondente na coluna 2 não são abreviaturas. Muitos desses itens são palavras do léxico, por exemplo, ir é o verbo ir etc. Sobre a terminologia, ver, por exemplo:

https://glossary.sil.org/

https://www.routledge.com/Routledge-Dictionary-of-Language-and-Linguistics/Bussmann-Kazzazi-Trauth/p/book/9780415203197

Sobre a distinção entre os diferentes tipos de demonstrativos, ver:

https://en.wikipedia.org/wiki/Demonstrative

Essas distinções estão codificadas nos tipos:

dem-prox-determiner-lex
dem-med-determiner-lex
dem-dist-determiner-lex
leoalenc commented 3 years ago

@arademaker, uma forma de documentar automaticamente os tipos de verbos é aplicar a gramática no conjunto de teste, produzindo, por exemplo, algo do tipo:

o cachorro quer:vol-verb-lex que o gato lata

o cachorro continua:ger-aux-lex querendo:bare-inf-aux-lex perseguir:trans-verb-lex o gato

I

leoalenc commented 3 years ago

@arademaker, uma forma de documentar automaticamente os tipos de verbos é aplicar a gramática no conjunto de teste, produzindo, por exemplo, algo do tipo:

o cachorro quer:vol-verb-lex que o gato lata

o cachorro continua:ger-aux-lex querendo:bare-inf-aux-lex perseguir:trans-verb-lex o gato

I

@arademaker, algo mais ousado é melhorar a visualização da hierarquia que é gerada pela Matriz.

leoalenc commented 2 years ago

Esta issue relaciona-se com o comentário de @arademaker: https://github.com/LR-POR/PorGram/issues/68#issuecomment-1024587709 assim como com #56 e #58.