ucd-dnp / leila

Librería para la evaluación de calidad de datos, e interacción con el portal de datos.gov.co
https://ucd-dnp.github.io/leila/
Other
59 stars 22 forks source link

Kriterion metricas calidad #5

Closed JorgeQuintanaL closed 3 years ago

JorgeQuintanaL commented 3 years ago

Se agregaron 9 métricas para la evaluación de la calidad de datos de los conjuntos de datos descargados desde datos.gov.co. Adicionalmente, se refactorizó el código agregando clases para Datos e Inventario. Este cambio hace que sea más sencillo el manejo del inventario y además almacena los datos y la metadata como atributos de los conjuntos de datos descargados, los cuales son cruciales para poder calcular las nuevas métricas de calidad de datos. También se arreglo un issue con la función de generar_reporte la cual fallaba cuando en el conjunto de datos no hay variables numéricas. Finalmente, se actualizó tanto el Notebook como los archivos .py de la carpeta de ejemplos, pero no se actualizó la documentación en la cerpeta docs ya que no tengo ni los datasets que usaron para ejecutar las pruebas ni el detalle para la generación de dicha documentación. Aquí pedimos su apoyo para re-generar la documentación una vez aceptados los cambios." [kriterion_metricas_calidad 61c8858] Se agregaron 9 métricas para la evaluación de la calidad de datos de los conjuntos de datos descargados desde datos.gov.co. Adicionalmente, se refactorizó el código agregando clases para Datos e Inventario. Este cambio hace que sea más sencillo el manejo del inventario y además almacena los datos y la metadata como atributos de los conjuntos de datos descargados, los cuales son cruciales para poder calcular las nuevas métricas de calidad de datos. También se arreglo un issue con la función de generar_reporte la cual fallaba cuando en el conjunto de datos no hay variables numéricas. Finalmente, se actualizó tanto el Notebook como los archivos .py de la carpeta de ejemplos, pero no se actualizó la documentación en la cerpeta docs ya que no tengo ni los datasets que usaron para ejecutar las pruebas ni el detalle para la generación de dicha documentación. Aquí pedimos su apoyo para re-generar la documentación una vez aceptados los cambios