Adalab / proyecto-da-promo-F-modulo-3-team-6

Talent Management
2 stars 2 forks source link

Fase 2: Transformación de los datos #3

Closed MRocioG closed 9 months ago

MRocioG commented 10 months ago

Limpieza de datos, la normalización, la conversión de tipos de datos y la aplicación de reglas empresariales específicas.

Usando funciones de Python que se aplicarán a los datos extraídos.

MRocioG commented 10 months ago
MRocioG commented 10 months ago

Employeenumber --> limpiamos duplicados en employeenumber, (mantenemos nan y valores únicos): Hemos tomado muestra de los datos que tenemos duplicados, donde observamos que el patrón es que el último registro es el que tiene mayor número de variables válidas (distancia a casa) y datos actualizados. Si quisiésemos hacer un estudio más detallado y dispusiésemos de más tiempo, ampliaríamos la muestra y haríamo sun análisix más exhaustivo de cada uno de los duplicados. --> tenemos 431 null en employeenumber

MRocioG commented 9 months ago

12/12/2023 Datos limpiados