IIC2115 / Syllabus-2020-2

Repositorio oficial del curso IIC2115 - Programación como Herramienta para la ingeniería - Segundo Semestre 2020
11 stars 29 forks source link

L04- Limpieza de datos #158

Closed jtjara1 closed 3 years ago

jtjara1 commented 3 years ago

Hola! quería preguntar lo siguiente sobre las 5 medidas de la p2. Existen diferentes maneras de trabajar con valores extremos, pero yo lo hice eliminando el 3% superior e inferior de la df (Vi en internet que recomendaban eso y en el ejemplo también se trabajaba con financial data). Primero eliminé el 3% superior de los datos, pero al hacer un describe, me di cuenta que el percentil 25 estaba muy alejado del min, por lo que también procedí a eliminar el 3% inferior (son comandos distintos). Mi pregunta es si esto cuenta como 2 medidas por separados o no, ya que primero elimino los valores extremos superiores, pero después me pareció pertinente eliminar los inferiores. Espero que se entienda mi consulta

pcseisdedos commented 3 years ago

Yo creo que ambos caen en la categoría de outliers, por lo que no veo mucha diferencia la verdad. De todas formas hay bastantes cosas que puedes arreglar, por lo que las 5 que debes mostrar no creo que sean un problema. Yo te recomiendo contarla como una y elegir otras 4 aparte de esta para mostrar.

Saludos, Pablo 😁👍