Closed MRocioG closed 9 months ago
Employeenumber --> limpiamos duplicados en employeenumber, (mantenemos nan y valores únicos): Hemos tomado muestra de los datos que tenemos duplicados, donde observamos que el patrón es que el último registro es el que tiene mayor número de variables válidas (distancia a casa) y datos actualizados. Si quisiésemos hacer un estudio más detallado y dispusiésemos de más tiempo, ampliaríamos la muestra y haríamo sun análisix más exhaustivo de cada uno de los duplicados. --> tenemos 431 null en employeenumber
12/12/2023 Datos limpiados
Limpieza de datos, la normalización, la conversión de tipos de datos y la aplicación de reglas empresariales específicas.
Usando funciones de Python que se aplicarán a los datos extraídos.