Closed leoalenc closed 3 years ago
O :space:
na regex também captura tabulação. Veja:
% grep "[[:space:]]" ~/Temp/teste.txt
1 2
1 2
1 2
ar@leme verbs % grep "\s" ~/Temp/teste.txt
1 2
1 2
1 2
ar@leme verbs % grep "[ ]" ~/Temp/teste.txt
1 2
1 2
ar@leme verbs % grep "[ ]$" ~/Temp/teste.txt
1 2
Para o arquivo de entrada aberto no Emacs com o whitespace-mode
onde conseguimos ver espaços como pontos e tabulação com o símbolo >>
.
See
ar@leme morpho-br % grep "[ ]$" nouns/*.dict
ar@leme morpho-br % grep "[ ]$" adjectives/*.dict
ar@leme morpho-br % grep "[ ]$" verbs/*.dict
ar@leme morpho-br % grep "[ ]$" adverbs/*.dict
ar@leme morpho-br % grep "[ ]" adverbs/*.dict
ar@leme morpho-br % grep "[ ]" verbs/*.dict
ar@leme morpho-br % grep "[ ]" nouns/*.dict
ar@leme morpho-br % grep "[ ]" adjectives/*.dict
Não temos espaços! apenas tabulações.
@arademaker, por acaso, verificando a questão dos prefixos de tags SBJ_ versus SUBJ, descobri que muitas entradas têm um espaço extra no final:
grep -Eho "\+SUBJ.+*" verbs/*.dict | sort | uniq -c
grep -Eho "\+SUBJ[^[:space:]]+*" verbs/*.dict | sort | uniq -c
É algo no mínimo deselegante que talvez devêssemos corrigir.