Closed abenassi closed 5 years ago
@poligarcia @abenassi Este issue estaría mejor encarado desde el punto de vista de monitoreo. Evita ponernos específicos en cómo se calculan los indicadores de federación (Otra red podría federar usando distinta política para los ids). Además la información ya está disponible desde el lado de monitoreo, es solo cuestión de procesarla.
@lrromero después de discutirlo con @poligarcia reafirmamos la conveniencia de hacerlo en pydatajson en lugar de monitoreo apertura para tener un control más "externo" de los datasets que efectivamente están federados con éxito en datos.gob.ar y no sólo que los hayamos marcado como federables al margen de que se hayan podido federar exitosamente o no.
La implementación debería ir por:
generate_catalogs_indicators
un diccionario de catálogos donde se interpreta que la key es el id.catalog_id + dataset_original_id
con dataset_federado_id
def generate_catalogs_indicators(catalogs, central_catalog=None,
validator=None):
"""Genera una lista de diccionarios con varios indicadores sobre
los catálogos provistos, tales como la cantidad de datasets válidos,
días desde su última fecha actualizada, entre otros.
Args:
catalogs (str o list *****o dict*****): uno o más catalogos sobre los que se quiera
obtener indicadores
El método
generate_catalogs_indicators(catalogs, central_catalog=None, validator=None)
admitiría que se pase undict
en el argumentocatalogs
que contenga como keys los catalog_id de cada catálogo (si se dispone de esa información).En este caso el método debería poder usar esta información para pasársela opcionalmente a
_federation_indicators()
y que la comparación entre dos datasets para saber si está federado o no, sea a través de los ids compuestos de los datasets y no a través de otros campos de metadatos como el título o el nombre del responsable.