dccuchile / beto

BETO - Spanish version of the BERT model
Creative Commons Attribution 4.0 International
492 stars 63 forks source link

Reproducir el test de POS #10

Open pboitier opened 4 years ago

pboitier commented 4 years ago

Buenas! Estaba queriendo ejecutar el test de Part of Speech en mi máquina. Veo que utilizaron la biblioteca Transformers de Huggingface, pero no encuentro la manera de utilizarla para el problema de POS. ¿Podrían compartir el código conmigo?

También me gustaría utilizar el mismo dataset que ustedes. Ví que listaron el dataset de Español de Universal Dependencies, pero dado que hay tres datasets distintos, no estoy seguro de cual utilizaron.

Gracias! Saludos, Pedro

josecannete commented 4 years ago

Hola Pedro,

En cuanto al dataset, usamos AnCora. Por otro lado, en cuanto al código, claro que sí. Por ahora el código está en Jupyter Notebooks, trataré de pasarlo a un script para que sea fácilmente reproducible y lo subiré apenas tenga tiempo.

Mientras tanto, cualquier duda de implementación que tengas puedes hacerla, te recomiendo basarte en el ejemplo de NER que tiene HuggingFace.

Saludos!