UniversalDependencies / UD_Portuguese-Bosque

This Universal Dependencies (UD) Portuguese treebank.
Other
50 stars 12 forks source link

neg removed in v2 #108

Closed fcbr closed 7 years ago

fcbr commented 7 years ago

Related to #102:

http://universaldependencies.org/v2/summary.html

We have 1345 of such relations. What should they be replaced with?

livyreal commented 7 years ago

most of all neg that points to a NOUN are negation of copula sentences, so the negation is related to the NOUN but actually it negates the whole sentence. Their are truly adverbs in my opinion, so I would relate " nao" and NOUN with advmod.

I think this is a reply to what @vcvpaiva said:

@livyreal disse: sim, pq não advmod?

@vcvpaiva: porque esta' modificando um substantivo.

vcvpaiva commented 7 years ago

OK, @livyreal! I am not very sure, but you have been working on this solidly for the last two months, you know better.

(it seems to me that, if all the cases are really what Nivre called "clausal negation", that is negation of the whole proposition, we will be fine. the issue is if the negation is only over the noun, as in the example "Essa sala e' de nao fumantes" that Claudia came up with, at some stage. but this doesn't seem a very common usage.)

arademaker commented 7 years ago

@livyreal anyway, it looks like the erros will have to be fixed manually, right? Just make sure to make the right decision without lose information.

fcbr commented 7 years ago

OK, I implemented it. Now we have only a handful of cases to change manually:

 19 PRON
  7 PROPN
  2 NUM

I have also updated the Turku interface: http://bosque.mybluemix.net/query?search=_%20%3Cneg%20_&db=bosque&case_sensitive=True&hits_per_page=50

livyreal commented 7 years ago

estes casos que faltam sao dificeis por que as guidelines de UD nao prevem que um ADV possa modificar expressos cujo POS nao seja ADJ ou VERB, mas isso acontece de fato em Portugues. Mando aqui a analise da Maria Helena Moura Neves (gramatica de usos do portugues), que aponta que adverbios, em PT, modificam sentencas, verbos, adjetivos, nomes, pronomes e numerais.

adv adv1

Eu seguiria a proposta dela, que faz muito sentido, e marcaria todos os antigos neg como advmod

Por exemplo,

" sorte do espectador que tera nao uma, mas duas mostras internacionais"

o " nao" nao esta modificando sentenca e nem o verbo, mas sim o sintagma nominal inteiro, que nesse caso 'e um NUM. Pra mim faz sentido dizer que "nao" modifica "uma" via advmod simplesmente.

o que acha @vcvpaiva ? falamos na documentacao de lingua especifica que em portugues, adverbios modificam varias classes morfologicas e que, por isso, advmod modifica nao apenas verbo e adjetivo, mas tambem PRON, NOUN, nome proprio e NUM.

vcvpaiva commented 7 years ago

muito obrigada @livyreal pela explicacao cuidadosa!!

mas confesso que continuo com o pe' atras, pois todos os exemplos acima (os seus e os do livro) sao exemplos de elipse, no meu entender. a "uma" modificada pelo "nao" na verdade e' "uma mostra internacional"--no que diz respeito a semantica.

e sim eu sei muito bem que nos fazemos muito, muito, mais elipse em portugues, do que se faz em ingles, mas pra mim nao esta' claro como lidar com elipse, nem em ingles, nem em portugues.

os pronunciamentos de Nivre et al nao estao me convencendo no que diz respeito a elipse. a frase que voce esta' discutindo com eles "They had left the company, many for good." is really a conjunction with ellipsis. they meant to say "They had left the company, and many have left for good." como 'e que alguem pode ter deixado a companhia sem ser "for good/pra sempre" eu nao sei, mas o sentido dessa frase e' esse, a conjuncao and foi elided e o verbo tambem!

dai que eu continuo dizendo (pra mim mesma) que advmod so' deve modificar verbo e adjetivo, que modificacoes de substantivoe sao erro, ou outro fenomeno, no caso, elipse. pra mim elipse e negacao sao os `bogeyman' desse tipo de analise. alas, I am glad I'm the logician, not the linguist!

livyreal commented 7 years ago

concordo, @vcvpaiva , que a analise de conjuncao e elipse sao os pontos problematicos na nova versao, mas veja que UD diz que quer fazer sintaxe de superficie, quer olhar para os tokens que existem, nao para os que nao existem, da'i que adverbio, na sintaxe de superficie, modifica nome, pronome, numeral, etc.

Esse mesmo tratamento (entender que adverbios modificam nomes, numerais, etc) vai ser necessario numa gramatica categorial, que eh bem mais logica do que linguistica, mas que olha apenas para tokens que estao realmente ali.

Podemos transformar tudo em advmod e depois apontamos este ponto critico da analise no nosso paper?

fcbr commented 7 years ago

Eu voto para mudarmos tudo pra advmod e marcarmos para uma futura revisao, com guidelines (possivelmente) melhores. Assim nao ficamos atrelando uma coisa a outra.

vcvpaiva commented 7 years ago

sim, claro que pode. eu achei que tinha deixado claro anteriormente. obrigada por perguntar!!

vcvpaiva commented 7 years ago

@livyreal os problemas sao nao so' elipse e conjuncao (que ja' sao problemas grandes) mas principalmente negacao e intensionalidade, tanto em "propositional attitudes" quanto em condicionais (que o Gabi e o Johan re-escrevem).

mas pelo menos em SICK nao temos condicionais (pelo menos teoricamente e procurando pelo lemma =if nao da' nada).

mas eu continuo sem entender bem as conjuncoes deles. eu achava que conjuncao devia ser diferente, devia ser um no' novo, com duas projecoes pra conjunct#1 e conjunct#2.

mas enfim, se alguem conseguir descobrir uma maneira de decidir que sentencas do SICK sao conjuncoes (PROP&PROP), que sentencas sao negacoes (notPROP) e que sentencas sao proposicoes atomicas (PROP) seria otimo!!!

2017-01-12 9:30 GMT-08:00 Livy Real notifications@github.com:

concordo, @vcvpaiva https://github.com/vcvpaiva , que a analise de conjuncao e elipse sao os pontos problematicos na nova versao, mas veja que UD diz que quer fazer sintaxe de superficie, quer olhar para os tokens que existem, nao para os que nao existem, da'i que adverbio, na sintaxe de superficie, modifica nome, pronome, numeral, etc.

Esse mesmo tratamento (entender que adverbios modificam nomes, numerais, etc) vai ser necessario numa gramatica categorial, que eh bem mais logica do que linguistica, mas que olha apenas para tokens que estao realmente ali.

Podemos transformar tudo em advmod e depois apontamos este ponto critico da analise no nosso paper?

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub https://github.com/own-pt/bosque-UD/issues/108#issuecomment-272227579, or mute the thread https://github.com/notifications/unsubscribe-auth/ABGdn36cd9yBTmwys0-dlmydZJKAMeBwks5rRmMcgaJpZM4LFWcl .

-- Valeria de Paiva http://research.nuance.com/author/valeria-de-paiva/ http://www.cs.bham.ac.uk/~vdp/ http://valeriadepaiva.org/

fcbr commented 7 years ago

Ainda estamos com neg no corpus:

$ grep -P '\tneg\t' *.conllu
CF703.conllu:10 nada    nada    ADV     ADV|@>A _       11      neg     _       _
CP207.conllu:22 nada    nada    ADV     ADV|@ADVL>      _       25      neg     _       _
CP245.conllu:1  Nada    nada    ADV     <quant>|ADV|@>A _       2       neg     _       _
CP388.conllu:8  nada    nada    ADV     <quant>|<det>|ADV|@>A   _       9       neg     _       _
CP510.conllu:1  Nada    nada    ADV     <quant>|<det>|ADV|@>A   _       2       neg     _       _
vcvpaiva commented 7 years ago

hmm, bom esse validator! 5 casos nao 'e tao problematico, ainda bem.

mas sera' que tem "ninguem" no corpus e nao 'e marcado como neg?

claudiafreitas commented 7 years ago

@fcbr, li todos os 5 casos e podem ficar como advmod. meu único ponto é com alguns "não" que modificam NOUNS e que devem estar como advmod, como o caso de "não substituição" e "não fumante", que pra mim são claramente COMPOUNDs..

fcbr commented 7 years ago

Working on it. As for the other compound comment, please open a separate issue.