LR-POR / MorphoBr

Resources for morphological analysis of Portuguese
Apache License 2.0
24 stars 4 forks source link

Inconsistency in assigning the NEG tag #82

Closed leoalenc closed 3 years ago

leoalenc commented 3 years ago

@arademaker, temos os seguintes advérbios com a etiqueta NEG:

grep -E "ADV\+NEG" adverbs/*.dict

jamais jamais+ADV+NEG nada nada+ADV+NEG nadinha nada+ADV+NEG não não+ADV+NEG

Com exceção de nadinha, todas essas palavras ocorrem também com a etiqueta ADV apenas. Essa é uma ambiguidade espúria que precisa ser removida. Resultou do tratamento distinto que DELAF_PB e FreeLing conferem a essas palavras. Proponho que eliminemos as duplicatas apenas com a etiqueta ADV. Descobri essa inconsistência por meio do relatório report-morpho-bosque.txt. Trata-se de issue relevante para https://github.com/cpdoc/test/issues/16#issuecomment-832086360.

vcvpaiva commented 3 years ago

@leoalenc esta' faltando pelo menos "quase" (Eu quase morri.=> eu nao morri) e "sem" (um filme do James Bond sem o Sean Connery.==> JamesBond \land not(SeanConnery))

leoalenc commented 3 years ago

@leoalenc esta' faltando pelo menos "quase" (Eu quase morri.=> eu nao morri) e "sem" (um filme do James Bond sem o Sean Connery.==> JamesBond \land not(SeanConnery))

@vcvpaiva, obrigado pelo comentário. O advérbio quase consta do repositório como ADV. Não sei, contudo, se seria adequado atribuir-lhe a etiqueta adicional +NEG, dada a sua definição. Além disso, parece ter um comportamento sintático diferente da palavras listadas acima. Compare:

Ela quase que morreu. Ela não que morreu. Ela jamais que morreu.

Sobre sem, é uma preposição, classe ainda não abarcada pelo repositório.

vcvpaiva commented 3 years ago

obrigada pela resposta @leoalenc , but como sempre eu estou pensando em semantica, nao na sintaxe. e na semantica "quase" modifica fundamentalmente o valor logico da assercao, por isso que queria te-lo marcado com ADV NEG.

da mesma forma a preposicao "SEM", que acredito que eventualmente vcs vao querer anotar tb, nao?

arademaker commented 3 years ago

Commit f8726f1 resolve este issue.