LR-POR / MorphoBr

Resources for morphological analysis of Portuguese
Apache License 2.0
24 stars 4 forks source link

incorrect 2nd person imperfect forms #84

Closed leoalenc closed 2 years ago

leoalenc commented 3 years ago

@arademaker, neste comentário, você menciona a seguinte forma:

chegava chegar+V+IMPF+2+SG

Isso me pareceu muito estranho! De fato, a segunda pessoa do singular, correspondente ao pronome tu, deveria terminar em s, ver, por exemplo:

CUNHA, C.; CINTRA, L. Nova gramática do português contemporâneo. 2. ed. Rio de Janeiro: Nova Fronteira, 1985.

Sei que alguns estudiosos, ao meu ver erroneamente, tratam você como pronome de segunda pessoa do singular. Ao fazê-lo, confundem sintaxe com semântica. Aprofundei essa questão no seguinte artigo:

ALENCAR, Leonel Figueiredo de. Modelação computacional de padrões variáveis de concordância em português. Revista de Estudos da Linguagem, Belo Horizonte, v. 21, n.1, p. 43-110, jan./jun. 2013.

Atualmente, temos:

grep -Eh "^.+ava[[:space:]].+\IMPF\+2\+SG" verbs/*.dict | wc -l

13386

grep -Ev "\+IMP\+" verbs/*.dict | grep -E "^.+[^s][[:space:]].+\+2\+SG" | wc -l

79630

Tirando o IMP, em vários tempos ocorrem formas de +2+SG não terminando em s, como mostra o último comando. Em português, apenas o imperativo afirmativo deve ter formas de segunda pessoa do singular não terminando em s. Devemos, portanto, eliminar todas as formas de segunda pessoa do singular que não terminam em s, exceto as do imperativo afirmativo:

grep -Eh "^.+[^s][[:space:]].+\+IMP\+2\+SG" verbs/*.dict

honra honrar+V+IMP+2+SG julga julgar+V+IMP+2+SG liga ligar+V+IMP+2+SG

Curiosamente, não temos formas de segunda pessoa do plural (salvo no IMP) terminando em m ou ão, apesar do pronome vocês exigir essas formas, uma incoerência que, segundo parece, herdamos dos recursos que utilizamos para construir o MorphoBr:

grep -Ev "\+IMP\+" verbs/*.dict | grep -E "^.+(m|ão)[[:space:]].+\+2\+PL" | wc -l

0

Desse modo, só precisamos fazer as eliminações acima especificadas.

arademaker commented 3 years ago

OK, mas não seria prudente conferir se para todos os casos temos a forma terminada em s para a segunda pessoa do singular? Para o exemplo que iniciou a discussão nós temos:

% rg "^chegava\t" *
verbs-aal.dict
16073:chegava   chegar+V+IMPF+1+SG
16074:chegava   chegar+V+IMPF+2+SG
16075:chegava   chegar+V+IMPF+3+SG

ar@tenis verbs % rg "^chegavas\t" *
verbs-aal.dict
16077:chegavas  chegar+V+IMPF+2+SG
arademaker commented 3 years ago

comando alternativo para achar os casos a serem eliminados:

% awk '$2 !~ /\+IMP\+/ && $1 !~ /s$/ && $2 ~ /\+2\+SG/ {print}' *.dict  | wc -l
   79630
leoalenc commented 3 years ago

OK, mas não seria prudente conferir se para todos os casos temos a forma terminada em s para a segunda pessoa do singular? Para o exemplo que iniciou a discussão nós temos:

% rg "^chegava\t" *
verbs-aal.dict
16073:chegava chegar+V+IMPF+1+SG
16074:chegava chegar+V+IMPF+2+SG
16075:chegava chegar+V+IMPF+3+SG

ar@tenis verbs % rg "^chegavas\t" *
verbs-aal.dict
16077:chegavas    chegar+V+IMPF+2+SG

@arademaker, sim, é bom fazer essa verificação.

analununes commented 2 years ago

O problema dessa issue foi tratado em #104.

arademaker commented 2 years ago

@analununes todas as formas mencionadas aqui são casos de formas verbais contraídas sem clítico? como vc testou?

analununes commented 2 years ago

@arademaker, @leoalenc disse acima:

Tirando o IMP, em vários tempos ocorrem formas de +2+SG não terminando em s, como mostra o último comando. Em português, apenas o imperativo afirmativo deve ter formas de segunda pessoa do singular não terminando em s. Devemos, portanto, eliminar todas as formas de segunda pessoa do singular que não terminam em s, exceto as do imperativo afirmativo:

Em #104, a primeira regra para eliminar formas espúrias se trata desse caso:

Se +IMP+ não é parte das features de uma forma de um dado lema de verbo, eliminar a forma se a primeira ou a segunda pessoa do plural não terminar em s.