Open vcvpaiva opened 8 years ago
Nós aprendemos que nossas nominalizações são os morphosemantic links de PWN. Isto é, relações entre instâncias de WordSense. Nominalizações não são entidades independentes das Word e WordSense de OWN-PT. Bem, algumas ainda são erroneamente relações entre instâncias de Word, mas sabemos que precisamos corrigir isso. Nominalizações são inseparáveis da OWN-PT, dado que referem-se a entidades de OWN-PT.
Em 2006, a distribuição da PWN em RDF [1] realmemente preocupava-se em distribuir os dados da forma mais modular possível, permitindo até cada (pointer/relação) estivesse em seu próprio arquivo. Idealmente poderiamos tentar reproduzir esta forma de distribuição, mas isto tem um custo e desenvolver um script para isso não é tão prioritário. O principal argumento em 2006 era a limitação de softwares e memória para carregar toda a PWN de uma vez:
The complete WordNet in RDF/OWL version described here consists of
different files and is over 150 MB uncompressed RDF/XML in
size. The required memory footprint when loading all files into
software such as SWI-Prolog's Semantic Web library may be double
that amount (figures vary for different software). To mitigate
memory shortage problems and/or improve query response times we
have made a separate file for each WordNet relation. The required
footprint can be dimished by loading only those files/relations
that are required by the application at hand.
Com a diversidade de ferramentas para RDF/OWL hoje, esta questão não é mais tão relevante. Carregar os dados em uma triplestore e separar as triplas relevantes não é tão complicado quanto era.
Nós aprendemos que nossas nominalizações são os morphosemantic links de PWN.
Nao sao nao! os moprhossemantic links sao so' algumas das nominalizacoes, nao sao todas que queremos. a classificacao deles tambem nao 'e necessariamente a que queremos. e no momento eles nao estao funcionando muito bem, no meu entender. os morphossemanitc links nos dao muitas sugestoes boas, mas e' esperado que muitdas dessas sugestoes nao funcionem pro portugues. nao temos nenhuma razao a priori pra acreditar que todos ou mesmo a maior parte dos morphossemantic links funcionem em portugues. enqto que o nomlex tem o problema oposto, os pares devem (na maioria, a menos de erro humano) estarem corretos, mas seu encaixe na rede PWN nao 'e garantido. ('e por isso que estamos criando o arquivo complicado dos chamados "synset candidates".) a possibilildade de download pode ser que esteja mais facil, mas se sim por que nao faze-lo facil pro consumidor? nesse caso estou pensando nos nossos usarios que sao linguistas. mas a possibilidade de consertar o nomlex enquanto nomlex devia ser oferecida tambem e nao e'. na minha opiniao essa 'e uma melhoria essencial.
On Jan 26, 2016, at 3:15 PM, Valeria de Paiva notifications@github.com wrote: Nao sao nao, os moprhossemantic links sao so' algumas das nominalizacoes, nao sao todas que queremos.
A modelagem é a mesma, link entre senses. Este é meu ponto principal.
a classificacao deles tambem nao 'e necessariamente a que queremos.
Idem.
e no momento eles nao estao funcionando muito bem, no meu entender. os morphossemanitc links nos dao muitas sugestoes boas, mas e' esperado que muitdas dessas sugestoes nao funcionem pro portugues.
Existem 2 discussões separadas aqui. Uma o que são os morpholinks/nominalizações, outra é como as entradas foram produzidas e como podem ser melhoradas.
nao temos nenhuma razao a priori pra acreditar que todos ou mesmo a maior parte dos morphossemantic links funcionem em portugues.
OK.
enqto que o nomlex tem o problema oposto, os pares devem (na maioria, a menos de erro humano) estarem corretos, mas seu encaixe na rede PWN nao 'e garantido. ('e por isso que estamos criando o arquivo complicado dos chamados "synset candidates".)
Por que faltam senses para PT? Então criamos synsets, correto.
a possibilildade de download pode ser que esteja mais facil, mas se sim por que nao faze-lo facil pro consumidor? nesse caso estou pensando nos nossos usarios que sao linguistas. mas a possibilidade de consertar o nomlex enquanto nomlex devia ser oferecida tambem e nao e'. na minha opiniao essa 'e uma melhoria essencial.
Na medida do possivel, quando tivermos tempo e recurso.
Bringing up the discussion here. Livy and I created the original NomLex-PT as a small hand-coded resource. It is good to have it connected to the OpenWordNet-PT, its bigger sister, but the data should be downloadable on its own and there should be an interface to correct it and improve it, independently from OWN-PT. This is the promise of the Open Linked Data, the fact that one can carry one with resources only vaguely aligned. . Some of the resources in the Portal da Lingua Portuguesa could be used for that, like the quality nouns.