cienciadedatos / datos-de-miercoles

Primo latinoamericano de #tidytuesday
Other
121 stars 72 forks source link

Datos de bicicletas en Buenos Aires #55

Closed eliocamp closed 5 years ago

eliocamp commented 5 years ago

Hola! Tengo una serie temporal de las estaciones de bicicletas públicas en Buenos Aires que estuve armando a partir de la API de transporte de la Ciudad de Buenos Aires. Estuve analizando los datos y publicando algunas cosas (acá, acá y acá)

Es poco menos de un mes (del 22 de julio al 15 de agosto) de datos de la cantidad de bicicletas estacionadas en cada una de las 399 estaciones sampleada cada 5 minutos. Todos los datos son medio pesados (el .csv pesa 135 MB) pero haciendo un subsampleo cada 10 minutos y quedándome sólo con las variables más interesantes, queda en 45Mb y haciendo cada 15 minutos baja a 30Mb.

Si les parece, puedo armarlo para publicar.

rivaquiroga commented 5 years ago

¡Suena bien! Podríamos subir la de 30 mb y dejar de todos modos el enlace a la de 135 por si alguien se anima a trabajar con un archivo más pesado. ¿Sabes si hay datos similares de otras ciudades latinoamericanas? Sería genial si pudiésemos incluir al menos una más.

eliocamp commented 5 years ago

La verdad que no sabría decirte. El tema es que esta base de datos la fui construyendo yo llamando a la API cada 5 minutos porque en ningún lugar se puede conseguir una serie temporal directamente. Si llegara a haber en otra ciudad, habría que armar todo y esperar como un mes.

¿Dónde se podría hostear el archivo pesado? No tengo mucha experiencia con eso.

rivaquiroga commented 5 years ago

135 Mb cabe acá en Github

eliocamp commented 5 years ago

Bárbaro. Tengo los datos listos. ¿Cómo hay que hacer?

rivaquiroga commented 5 years ago

Puedes hacer un pull request con la carpeta con los datos y el readme siguiendo como modelo una de las semanas anteriores

rivaquiroga commented 5 years ago

¡Publicado!