IslasGECI / seleccion_analista_2022_mvb

🐍 Mario Villasante Barahona
GNU Affero General Public License v3.0
0 stars 0 forks source link

Examen de selección 2022 para Analista de Datos en GECI

Predicción de la edad de pollos de petrel negro a partir de su morfometría

Debes estimar la edad (en días) de un conjunto de pollos de petrel negro a partir de su morfometría. Someterás tu respuesta como una tabla de dos columnas: la primera columna es el identificador del pollo y la segunda columna es la edad estimada. Esperamos ver avances graduales en ciclos cortos. Nos gustaría que el examen lo resuelvas con muchos pull requests y que cada pull request tenga un avance muy pequeño (menos de 100 líneas). Por lo que te proponemos:

  1. Crea un fork de este repositorio
  2. Cubre tu código con pruebas
  3. Haz pasar GitHub Actions
  4. Haz múltiples pull requests pequeños (menos de 100 líneas cada uno)
  5. Usa GitHub (issues y pull requests) como el medio de comunicación principal

Por favor no esperes a terminar el examen para someter tu primer pull request. Recuerda que no podrás crear ningún pull request hasta que tengas tu fork.

Rúbrica

El objetivo de este examen de selección es evaluar las habilidades para el trabajo colaborativo a distancia. Para eso usaremos los siguientes rubros:

Sugerencias

Instrucciones

  1. Ajusta un modelo con el archivo train.csv
  2. Evalúa el modelo ajustado en test.csv
  3. Guarda la respuesta de tu modelo en <TU_NOMBRE>_submission.csv

Reemplaza <TU_NOMBRE> con tu nombre.

Configuración

Guarda tu respuesta <TU_NOMBRE>_submission.csv en la carpeta pollos_petrel/. En el Makefile de este repo, agrega al phony submissions la ruta completa de tu respuesta: pollos_petrel/<TU_NOMBRE>_submission.csv

El phony submissions debería verse así:

submissions: \
    pollos_petrel/example_python_submission.csv \
    pollos_petrel/example_r_submission.csv \
    pollos_petrel/<OTRO_NOMBRE>_submission.csv \
    pollos_petrel/<TU_NOMBRE>_submission.csv

Nota las diagonales invertidas \ al final de cada línea, excepto en la última

Agrega al Makefile como objetivo tu respuesta pollos_petrel/<TU_NOMBRE>_submission.csv. Esta tabla debe tener dos columnas: id y target. Ve el ejemplo: pollos_petrel/example_submission.csv.

Ejemplo:

id target
2013-09-16-H9 0.83
2015-09-02-B5 0.94
2017-09-09-A9 0.50

Reglas

Descripción de las tablas

En el directorio pollos_petrel/ puedes encontrar tres archivos CSV.

Descripción de los campos de las tablas

Resultados

Te recomendamos que sometas al menos dos modelos. El mejor modelo es el que obtenga el menor error absoluto medio (MAE). Puedes ver los resultados de tu modelo en GitHub Actions en la sección Evaluate a directory.

Referencias