PUC-Infovis / syllabus-2019

Repositorio principal para el curso “Visualización de Información” del año 2019.
12 stars 2 forks source link

[T01] Errores en Dataset #3

Closed joseluishaddad closed 5 years ago

joseluishaddad commented 5 years ago

Hola!, En cuanto a los errores para que tenemos que filtrar, estos serán solo los que aparecen en los datos que nos entregaron (negativos, class=3.45 y NaNs) o algo más. Gracias!

ouhenio commented 5 years ago

Hola! Los errores que mencionaste son los únicos posibles. Saludos!

yoavnavon commented 5 years ago

@eiherrera Hola! En el training.csv hay atributos repetidos para un mismo id de planta. Por ejemplo para el ID=150, el atributo sepal_length aparece dos veces, primero con valor -7 y despues con valor -9.2. Que hacemos con estos datos? Gracias!

ouhenio commented 5 years ago

Hola Yoav! Dado que su valor es negativo tienes que borrarlos, por lo que no interfiere que se repitan. Saludos!

yoavnavon commented 5 years ago

Ahh no me había fijado que en todos esos casos eran negativos.. gracias!!