ucd-dnp / leila

Librería para la evaluación de calidad de datos, e interacción con el portal de datos.gov.co
https://ucd-dnp.github.io/leila/
Other
59 stars 22 forks source link

Duplicados de columnas - tamaño límite #8

Open pablomonhel opened 3 years ago

pablomonhel commented 3 years ago

Definir el tamaño límite de un conjunto de datos sobre el cual no utilizar la función "EmparejamientoDuplicados" para columnas y poner en documentación para que sea visto por usuarios. EL cálculo de duplicados por columnas es el más lento de toda la librería y no se recomienda para conjuntos de datos muy grandes por su demora en la ejecución.

Esto se revisará después de optimizar la función "EmparejamientoDuplicados"