cpdoc / dhbb-nlp

processamentos DHBB
Other
5 stars 2 forks source link

Opennlp e frases corrigidas #46

Closed lucasrct closed 4 years ago

lucasrct commented 4 years ago

Mais frases corrigidas no arquivo primeiras_frases/frases.conllu, algumas fiquei com dúvidas e coloquei o status como pendente. Para encontrar o sent id, basta digitar

awk '$0 ~ /# status = pendente/ {print a}{a=$0}' frases.conllu

no diretório primeiras_frases.

Adicionado um readme.train na pasta opennlp assim como um script para automaticamente gerar o modelo a partir das frases que escolhemos do DHBB.