Roj / corrector

Sistema de corrección automática para ejercicios de Spark y Pandas.
MIT License
0 stars 2 forks source link

[BUG] Pandas - Ejercicio 2 no evalua lo que se pide #3

Open gonzaloea opened 5 years ago

gonzaloea commented 5 years ago

Descripción del bug Según el enunciado debería devolverse un un nuevo dataframe con las columnas movimiento, horas_totales. Sin embargo, toma salida esperada el dataset joineado y con un group_by.

Pasos para reproducirlo Una serie de pasos para poder producir el bug.

  1. Ir a a la página..
  2. Escribir el código del ejercicio 2 solo realizando un join y un group by..
  3. Enviar..
  4. Ver que se toma como correcto pero no es lo que pide el enunciado

Comportamiento esperado Deberia fallar, ya que por el enunciado deberia esperarse un nuevo dataframe con las columnas movimiento, horas_totales.

Roj commented 5 years ago

Hola,

gracias por el bug report! En este caso puede ser que esté mal redactado el enunciado (culpa mía). Efectivamente lo que se espera es el join y group_by. Creo que no entendí cómo es tu interpretación del enunciado, lo que entiendo es que decís que es suficiente devolver un nuevo dataframe con columnas movimiento y horas_totales, pero la respuesta a la pregunta ("¿Cuántas horas de música de compositores famosos tenemos para cada período?") está en el valor de esas columnas, de ahí la idea del join y group_by. El dataframe joineado es un nuevo dataframe.

¿Qué te parece la siguiente re-escritura?

Haydn perteneció al período clásico de la música, Handel al período barroco. Tenemos un dataframe con la cantidad de horas de música por compositor (columnas compositor, cantidad_horas) y otro con el movimiento al que pertenece cada uno (columnas compositor, movimiento). Queremos saber cuántas horas de música tenemos por período musical (para algunos compositores famosos). Devolver un nuevo dataframe con columnas movimiento, horas_totales donde cada fila indique la cantidad de horas de música registradas para ese movimiento.

De todas maneras me gustaría leer tu interpretación del enunciado anterior para tenerlo en cuenta al redactar futuros ejercicios.

Gracias! Saludos, Joaquín

gonzaloea commented 5 years ago

Hola Joaquin, Lo que pasa es que se toma como correcto que el dataset final tenga las columnas "movimiento" y "cantidad_horas". No como dice actualmente el enunciado ( "movimiento" y "horas_totales"). Si le cambias el nombre a la columna "cantidad_horas" por "horas_totales", no te lo toma bien el corrector. Se entiende?

Gracias a vos, Saludos!