Hola. Aquí dejaré información acerca de la tarea 1 que preguntaron en distintas issues.
General
Pueden hacer uso de las librerías que estimen convenientes para la tarea.
Como se indica en el enunciado cuentan con tres sets de datos mediciones gps.csv, mediciones gps2.csv y un tercer set cuyo enlace está en el enunciado, este último set es mucho más robusto que los dos anteriores y cuenta con mediciones hechas los fines de semana, lo cual puede servirles para la misión 8.
Un servicio es como el número del bus (la línea), el cual estaría indicado por la columna line_id o line_code.
La distancia recorrida, refiriéndose a lo dicho en la descripción para la columna distance_kms, se refiere a los kilómetros que ha recorrido el bus desde su despacho (dispatch_time) hasta el instante de la medición GPS (gps_time).
Misión 8
Para esta misión no se espera que los gráficos tengan una forma de una distribución conocida por ejemplo distribución normal o alguna otra. Se esperaría que logren generar un gráfico y en base a este den una explicación del motivo que sean así.
Misión 9
No hay una precisión mínima establecida para las predicciones, sin embargo, se espera que se realice un análisis del rendimiento del modelo y de los resultados. El foco es que el desarrollo esté metodológicamente correcto.
Misión 10
No hay un número mínimo o máximos de features para realizar la agrupación. Sin embargo, se recomienda que prueben con distintos números de features que estimen relevantes hasta conseguir un resultado con el que estén satisfechos.
Hola. Aquí dejaré información acerca de la tarea 1 que preguntaron en distintas issues.