LR-POR / tools

Tools for checking the compatibility between a lexical resource and a treebank
BSD 3-Clause "New" or "Revised" License
2 stars 0 forks source link

add export function #23

Open arademaker opened 3 years ago

arademaker commented 3 years ago

@lucasrct no extrator de valencias em um arquivo CSV. Assim poderíamos usar recursos do Excel como o pivot table.

image

Muitas diateses tem apenas 1 verbo! E uma lista das diateses com seus verbos também deve ajudar o @leoalenc

image

arademaker commented 3 years ago

pensando aqui ... a partir das diateses não poderiamos tentar inferir a melhor hierarquia dos tipos ? Tipo https://uc-r.github.io/hc_clustering? Obviamente a desvantagem é que só estamos considerando verbos de um corpus específico...

Outra vantagem é que o @leoalenc poderia ir anotando tipos para cada diatese, agrupando elas em tipos e acompanhando o resultado...

arademaker commented 3 years ago

Em be8a847 fiz uma primeira ideia, mas ficamos sem os exemplos...

leoalenc commented 3 years ago

pensando aqui ... a partir das diateses não poderiamos tentar inferir a melhor hierarquia dos tipos ? Tipo https://uc-r.github.io/hc_clustering? Obviamente a desvantagem é que só estamos considerando verbos de um corpus específico...

Outra vantagem é que o @leoalenc poderia ir anotando tipos para cada diatese, agrupando elas em tipos e acompanhando o resultado...

@arademaker , ótimas sugestões. Mas antes de eu atribuir diáteses a tipos da gramática ou construir novos tipos com base nessas diáteses precisaria de um exemplo de cada diátese. Tenho encontrado muitos erros no corpus, portanto, estaria criando tipos para árvores dependenciais espúrias. Por exemplo, a diátese do verbo perguntar na primeira linha da sua tabela parece estranha.