Open arademaker opened 3 years ago
pensando aqui ... a partir das diateses não poderiamos tentar inferir a melhor hierarquia dos tipos ? Tipo https://uc-r.github.io/hc_clustering? Obviamente a desvantagem é que só estamos considerando verbos de um corpus específico...
Outra vantagem é que o @leoalenc poderia ir anotando tipos para cada diatese, agrupando elas em tipos e acompanhando o resultado...
Em be8a847 fiz uma primeira ideia, mas ficamos sem os exemplos...
pensando aqui ... a partir das diateses não poderiamos tentar inferir a melhor hierarquia dos tipos ? Tipo https://uc-r.github.io/hc_clustering? Obviamente a desvantagem é que só estamos considerando verbos de um corpus específico...
Outra vantagem é que o @leoalenc poderia ir anotando tipos para cada diatese, agrupando elas em tipos e acompanhando o resultado...
@arademaker , ótimas sugestões. Mas antes de eu atribuir diáteses a tipos da gramática ou construir novos tipos com base nessas diáteses precisaria de um exemplo de cada diátese. Tenho encontrado muitos erros no corpus, portanto, estaria criando tipos para árvores dependenciais espúrias. Por exemplo, a diátese do verbo perguntar na primeira linha da sua tabela parece estranha.
@lucasrct no extrator de valencias em um arquivo CSV. Assim poderíamos usar recursos do Excel como o pivot table.
Muitas diateses tem apenas 1 verbo! E uma lista das diateses com seus verbos também deve ajudar o @leoalenc