ucd-dnp / leila

Librería para la evaluación de calidad de datos, e interacción con el portal de datos.gov.co
https://ucd-dnp.github.io/leila/
Other
59 stars 22 forks source link

Mejorar tiempos de ejecución en cálculo de duplicados de columnas #23

Open pablomonhel opened 3 years ago

pablomonhel commented 3 years ago

Reducir los tiempos de ejecución al calcular los duplicados de columnas, especialmente para conjuntos de datos muy grandes. Se estudiará agregar un parámetro para seleccionar algunas filas de las columnas al hacer la verificación de duplicados. Este número podrá ser cambiado por el usuario