Closed leoalenc closed 3 years ago
OK, mas não seria prudente conferir se para todos os casos temos a forma terminada em s
para a segunda pessoa do singular? Para o exemplo que iniciou a discussão nós temos:
% rg "^chegava\t" *
verbs-aal.dict
16073:chegava chegar+V+IMPF+1+SG
16074:chegava chegar+V+IMPF+2+SG
16075:chegava chegar+V+IMPF+3+SG
ar@tenis verbs % rg "^chegavas\t" *
verbs-aal.dict
16077:chegavas chegar+V+IMPF+2+SG
comando alternativo para achar os casos a serem eliminados:
% awk '$2 !~ /\+IMP\+/ && $1 !~ /s$/ && $2 ~ /\+2\+SG/ {print}' *.dict | wc -l
79630
OK, mas não seria prudente conferir se para todos os casos temos a forma terminada em
s
para a segunda pessoa do singular? Para o exemplo que iniciou a discussão nós temos:% rg "^chegava\t" * verbs-aal.dict 16073:chegava chegar+V+IMPF+1+SG 16074:chegava chegar+V+IMPF+2+SG 16075:chegava chegar+V+IMPF+3+SG ar@tenis verbs % rg "^chegavas\t" * verbs-aal.dict 16077:chegavas chegar+V+IMPF+2+SG
@arademaker, sim, é bom fazer essa verificação.
O problema dessa issue foi tratado em #104.
@analununes todas as formas mencionadas aqui são casos de formas verbais contraídas sem clítico? como vc testou?
@arademaker, @leoalenc disse acima:
Tirando o IMP, em vários tempos ocorrem formas de +2+SG não terminando em s, como mostra o último comando. Em português, apenas o imperativo afirmativo deve ter formas de segunda pessoa do singular não terminando em s. Devemos, portanto, eliminar todas as formas de segunda pessoa do singular que não terminam em s, exceto as do imperativo afirmativo:
Em #104, a primeira regra para eliminar formas espúrias se trata desse caso:
Se +IMP+ não é parte das features de uma forma de um dado lema de verbo, eliminar a forma se a primeira ou a segunda pessoa do plural não terminar em s.
@arademaker, neste comentário, você menciona a seguinte forma:
Isso me pareceu muito estranho! De fato, a segunda pessoa do singular, correspondente ao pronome tu, deveria terminar em s, ver, por exemplo:
CUNHA, C.; CINTRA, L. Nova gramática do português contemporâneo. 2. ed. Rio de Janeiro: Nova Fronteira, 1985.
Sei que alguns estudiosos, ao meu ver erroneamente, tratam você como pronome de segunda pessoa do singular. Ao fazê-lo, confundem sintaxe com semântica. Aprofundei essa questão no seguinte artigo:
ALENCAR, Leonel Figueiredo de. Modelação computacional de padrões variáveis de concordância em português. Revista de Estudos da Linguagem, Belo Horizonte, v. 21, n.1, p. 43-110, jan./jun. 2013.
Atualmente, temos:
grep -Eh "^.+ava[[:space:]].+\IMPF\+2\+SG" verbs/*.dict | wc -l
grep -Ev "\+IMP\+" verbs/*.dict | grep -E "^.+[^s][[:space:]].+\+2\+SG" | wc -l
Tirando o IMP, em vários tempos ocorrem formas de +2+SG não terminando em s, como mostra o último comando. Em português, apenas o imperativo afirmativo deve ter formas de segunda pessoa do singular não terminando em s. Devemos, portanto, eliminar todas as formas de segunda pessoa do singular que não terminam em s, exceto as do imperativo afirmativo:
grep -Eh "^.+[^s][[:space:]].+\+IMP\+2\+SG" verbs/*.dict
Curiosamente, não temos formas de segunda pessoa do plural (salvo no IMP) terminando em m ou ão, apesar do pronome vocês exigir essas formas, uma incoerência que, segundo parece, herdamos dos recursos que utilizamos para construir o MorphoBr:
grep -Ev "\+IMP\+" verbs/*.dict | grep -E "^.+(m|ão)[[:space:]].+\+2\+PL" | wc -l
Desse modo, só precisamos fazer as eliminações acima especificadas.