Debes estimar la edad (en días) de un conjunto de pollos de petrel negro a partir de su morfometría. Someterás tu respuesta como una tabla de dos columnas: la primera columna es el identificador del pollo y la segunda columna es la edad estimada. Esperamos ver avances graduales en ciclos cortos. Nos gustaría que el examen lo resuelvas con muchos pull requests y que cada pull request tenga un avance muy pequeño (menos de 100 líneas). Por lo que te proponemos:
Por favor no esperes a terminar el examen para someter tu primer pull request. Recuerda que no podrás crear ningún pull request hasta que tengas tu fork.
El objetivo de este examen de selección es evaluar las habilidades para el trabajo colaborativo a distancia. Para eso usaremos los siguientes rubros:
Capacidad para el trabajo colaborativo a distancia:
Buenas prácticas en programación:
train.csv
test.csv
<TU_NOMBRE>_submission.csv
Reemplaza
<TU_NOMBRE>
con tu nombre.
Guarda tu respuesta <TU_NOMBRE>_submission.csv
en la carpeta pollos_petrel/
. En el Makefile de
este repo, agrega al phony submissions la ruta completa de tu respuesta:
pollos_petrel/<TU_NOMBRE>_submission.csv
El phony submissions debería verse así:
submissions: \
pollos_petrel/example_python_submission.csv \
pollos_petrel/example_r_submission.csv \
pollos_petrel/<OTRO_NOMBRE>_submission.csv \
pollos_petrel/<TU_NOMBRE>_submission.csv
Nota las diagonales invertidas
\
al final de cada línea, excepto en la última
Agrega al Makefile como objetivo tu respuesta pollos_petrel/<TU_NOMBRE>_submission.csv
. Esta tabla
debe tener dos columnas: id y target. Ve el ejemplo: pollos_petrel/example_submission.csv
.
Ejemplo:
id | target |
---|---|
2013-09-16-H9 | 0.83 |
2015-09-02-B5 | 0.94 |
2017-09-09-A9 | 0.50 |
make pollos_petrel/<TU_NOMBRE>_submission.csv
debe reproducir tu respuesta
(pollos_petrel/<TU_NOMBRE>_submission.csv
) a partir de los datos test.csv
. Todo el código debe
correr dentro del contenedor. No se vale consignar la respuesta o números mágicos. Sólo puedes
consignar código.En el directorio pollos_petrel/
puedes encontrar tres archivos CSV.
train.csv
para ajustar tu modelo (entrenar tu algoritmo).test.csv
para evaluar tu modelo ajustado.example_submission.csv
como ejemplo de respuesta.train.csv
y example_submission.csv
, la última columna se llama target y
contiene la edad (en días) de los pollos. Esta columna representa la respuesta.test.csv
y train.csv
, el resto de las columnas ( Masa, Longitud_tarso,
..., Longitud_pluma_exterior_de_la_cola) son las variables predictivas.Te recomendamos que sometas al menos dos modelos. El mejor modelo es el que obtenga el menor error absoluto medio (MAE). Puedes ver los resultados de tu modelo en GitHub Actions en la sección Evaluate a directory.