cpdoc / dhbb-nlp

processamentos DHBB
Other
5 stars 2 forks source link

Adicionado binário do udpipe, modelo treinado com o bosque e frases corrigidas. #41

Closed lucasrct closed 4 years ago

lucasrct commented 4 years ago

Foi adicionado:

  1. Binário contendo o UDPipe.
  2. Modelo do udpipe treinado com o Bosque.
  3. Arquivo com as frases corrigidas (ainda em execução) do arquivo frases.txt.
  4. Shell script para facilitar a análise de strings.

Informações detalhadas no README.

Obs.: Possível erro na segunda frase? Aparenta ter uma palavra desnecessária (frase 2, token 13).

arademaker commented 4 years ago

@lucasrct não vamos colocar o binário do udpipe neste repositório. Não faz sentido isso, qualquer um de nós pode pegar o binário no site do udpipe.

arademaker commented 4 years ago

faça novo PR sem o binário.

arademaker commented 4 years ago

O arquivo primeiras_frases/frases_corigidas.conllu~ não deveria ser colocado no repositório, é um backup.

o modelo também não precisa ser colocado se as instruções para treino ficarem bem documentadas.

arademaker commented 4 years ago

Mas eventualmente o modelo podemos deixar.

lucasrct commented 4 years ago

Farei o novo PR sem o binário do udpipe (agora) e tb a documentação de como treinar o modelo (em breve).