Closed sebasrod closed 5 years ago
Incluye nuevo parámetro HIVE_HourToUpdateMetadata en GlobalSettings,
Este parámetro tiene valor por default 0, lo que significa que no guarda los datos en cache temporal (parquet en ruta temporal).
Al asignar un valor > a 0 (por ejemplo 5), significa que guardará la información de metadata de Hive en cache en parquet, y durante esas 5 horas las leerá desde ahí en vez de rescatar desde Hive. Una vez que hayan pasado las 5 horas, la siguiente ejecución generará un refresh del caché, leyendo nuevamente la información desde Hive.
Para activar, se debe incluir el parámetro HIVE_HourToUpdateMetadata en globalSettings.
Ejemplo:
HIVE_HourToUpdateMetadata = 2 //dos horas para mantener metadata de hive en cache.
Finalizado.
Implementar mejora en lectura de metadata HIVE.
Dada la lentitud de Hive de entregar la metadata, se implementará una función que obtiene la metadata y la guarda en un archivo PARQUET en la ruta temporal, si la fecha de este archivo supera las 24 horas, entonces el proceso ejecutará automáticamente nuevamente el proceso.