IIC2115 / Syllabus-2021-1

Syllabus del curso IIC2115 - Programación como Herramienta para la Ingeniería 2021/I
9 stars 48 forks source link

Problema con los datos de Movie #14

Closed nencinav closed 3 years ago

nencinav commented 3 years ago

Al revisar los datos respectivos a la actividad 1, pude notar que hay autores con nombres como ",", "(",etc. . A modo de ejemplo, adjunto una foto. De igual manera, existe mas de un actor con el mismo nombre ("Harrison Ford"), entonces al ver su primera y su última película, existe una diferencia de 98 años. (Supe que eran diferentes actores porque lo busque en internet, pero tienen exactamente el mismo nombre). ¿Esto es normal, hay que borrar esos casos o cómo se procede?

Captura de Pantalla 2021-04-05 a la(s) 18 51 21

nopaez commented 3 years ago

Encontré exactamente lo mismo, tengo las mismas dudas sobre qué hacer. Me sumo a la consulta!

agrego que los datos capturados dejaron en actores frases como "Voices of", "(voices of)", "the", "and", por ejemplo para películas animadas. Lo anterior afecta para hacer el ranking de actores con más trayectoria y junto a lo de los dos Harrison Ford hay una actriz cuya trayectoria es 8 años menos que su última película lanzada (relanzamiento póstumo de una de sus películas) y también afecta la veracidad de la respuesta que se puede conseguir con la data actual.

pcseisdedos commented 3 years ago

En esta oportunidad no es necesario que lo tomen en cuenta, pero es bien visto. Sin embargo, en las siguientes si esperamos que se hagan cargo de este tipo de cosas.

Respecto a la pregunta de si es normal, totalmente. Las bases de datos reales están llenas de errores, así que es importante que se familiaricen con ellas y aprendan a depurarlas.

Saludos, Pablo 😁👍