avanco / UGCNormal

Normalizer tool for user-generated content (Brazilian Portuguese)
Other
12 stars 2 forks source link

configure.sh não confere módulo soundex #1

Closed staticdev closed 6 years ago

staticdev commented 6 years ago

Ao rodar o normalizador recebo o erro:

index

avanco commented 6 years ago

olá Thiago,

tente mudar em spell.pl o caminho que o speller utiliza:

# use lib => for pre-processing UGCNormal module
#use lib "$ENV{HOME}/ugc_norm/speller";
# use lib => run Speller
use lib ".";
staticdev commented 6 years ago

Desculpe minha ignorância em Perl. Não seria um cpanp -i Text::Soundex ? Fiz isso para o Text::LevenshteinXS e Parallel::Loops.

staticdev commented 6 years ago

É um módulo interno né?

avanco commented 6 years ago

sim, isso, é um módulo interno veja se funciona mudando para use lib ".";

carolcoimbra commented 6 years ago

Parece que mudando para use lib "."; funciona. Mas aparecem novos erros. image

avanco commented 6 years ago

o caminho para resources não deve estar ok

Tente forçar o path completo para testar. Tente tirar essa var de ambiente nas seguintes linhas de spell.pl e colocar o path completo

   352      $siglas_lexicon_file = "$ENV{PWD}/resources/lexico_siglas.txt";
   353      $int_lexicon_file = "$ENV{PWD}/resources/lexico_internetes.txt";
   354      $int_sigl_lexicon_file = "$ENV{PWD}/resources/lexico_internetes_sigl_abrv.txt";
   355      $np_lexicon_file = "$ENV{PWD}/resources/lexico_nome_proprio.txt";
   356      $estr_lexicon_file = "$ENV{PWD}/resources/lexico_estrangeirismo.txt";
   357      $medidas_lexicon_file = "$ENV{PWD}/resources/lexico_unidade_medida.txt";
   428      $blacklist = "$ENV{PWD}/resources/blacklist_gemeas.txt";
staticdev commented 6 years ago

Fiz uma versão que já configura tudo no docker: https://github.com/staticdev/ugcnormal-microservice. Acho que podemos fechar esse issue.