Open hlecuanda opened 4 years ago
Hola. Sí, la Secretaría de Salud sí actualiza los datos todos los días, aproximadamente las 7 pm de la Ciudad de México, además de dar una conferencia de prensa a esa hora. Pero no siempre tengo tiempo de analizar todos los datos, por lo que en ocasiones yo soy el que no actualiza el repositorio. Trato de hacerlo todos los días, pero el proceso de pasar de pdf a csv y revisar que no haya fallas es cada vez más largo y tedioso. Muchas gracias por tu interés, saludos!
yo estoy automatizando la actualización de https://hlo.mx/covid19 del repositorio de OWiD en automático con unas funciones ad-hoc de google apps script, pero eso se acomoda mas al uso de los datos en google sheets.
Estaría encantado de ayudar a automatizar el proceso, para no duplicar los esfuerzos, igual voy empezando a escribir un extractor en python que planeo correr periódicamente con Google Cloud Run (un contenedor automatizado con un cron job virtual) con la ventaja de ser portátil y compatible con diversas infraestructuras. ... igual si lo termino antes de que veas este mensaje te podría servir a tí, aunque lo ideal sería evitar la duplicación de fuentes y esfuerzos.
Saludos, y gracias
(igual dejo abierto el issue en espera de una decisión)
Me gusta mucho tu idea de automatizar la extracción, y trabajar juntos en esto. Como te digo, soy nuevo en Git, pero con muchísimo gusto me pongo a leer para ver qué podemos hacer bien juntos. Te gustaría escribirme a mi correo? alancarrillop@gmail.com
Muchas gracias de nuevo por la mano tendida, saludos!
Enterado, email enviado =) Saludos igualmente
Saludos! Una pregunta:¿La secretaría de salud no está actualizando sus datos en fin de semana? pregunto porque veo que tiene dos dias sin actualizarse el dataset y me preocupa que quede "stale"