nathanshartmann / portuguese_word_embeddings

Portuguese Word Embeddings: Evaluating on Word Analogies and Natural Language Tasks
GNU General Public License v3.0
240 stars 35 forks source link

Acesso ao dataset de treinamento #17

Closed bratao closed 1 year ago

bratao commented 4 years ago

Olá tudo bem? @nathanshartmann

Sou pesquisador da Universidade Federal da Bahia, e estou juntando um dataset para treinar alguns modelos de transformers como o ALBERT e REFORMER. O modelo será publicado e os devidos creditos obviamente serão dados. Você pode compartilhar o dataset utilizado comigo?

Meu email é bruno-at-potelo.com.br

nathanshartmann commented 1 year ago

Boa tarde. Tudo bem?

Estamos feliz em anunciar que a parcela pública do dataset está disponível para download em http://nilc.icmc.usp.br/embeddings