Closed miglesias91 closed 3 years ago
java -mx1g -cp "herramientas/stanford-corenlp-4.2.0/*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -serverProperties StanfordCoreNLP-spanish.properties -props spanish -annotators "tokenize,ssplit,pos,lemma,ner" -port 9000 -timeout 15000
con eso levanto corenlp server local para desarrollar
usar Stemmer. stanford no tiene lemmatizador en español. adaptarlo a stemmer y a la mierda. ver de guardar palabras completas pero cuando buscamos aplicarle stemmer.
vuelta de rosca para lemmatizar: traduzco al ingles, lemmatizo en ingles, y vuelvo a traducir al español. A CHEQUEAR:
ver de meter un traductor local: apertium, freedict, etc etc.
testear branch corenlp en ssh-admin. ver si corre.
corre todo. desde ssh-admin us ssh-dlm-nlp. correr dlm-leer en ssh-admin y si funca ya dejarlo ahi y dar de baja el de aws.
desde ssh-admin levantar corenlp con levantar-corenlp-nohup & : nohup java -mx1g -cp "/home/ubuntu/stanford-corenlp-4.2.1/*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -serverProperties StanfordCoreNLP-spanish.properties -props spanish -annotators "tokenize,ssplit,pos,lemma,ner" -quiet true -port 9000 -timeout 15000
agregar frecuenciasstanfordnlp.py, que use el wrapper de python. al toque.