Closed PyMap closed 11 months ago
No me queda 100% clara la diferencia entre un h5 y tener los dfs sueltos en storage google y simplemente bajar los necesarios, pero no estoy casado con ninguna idea. Quizás lo más barato sea tener tablas en DBs. AWS al menos tiene tier gratuito de DB y tira un buen par de GB, pero de nuevo, eso es lo que sea más gratis, y más fácil.
El h5 es un buen recurso para no tener que manipular muchos files. Pero se vuelve incómodo para actualizarlo.
Son todos datasets públicos, con lo cual podríamos crear un bucket en GCS como sugeriste vos inicialmente @NMonnerSans y ya resolverlo rápido.
Si es más práctico y nos permite avanzar más rápido puedo crear un directorio en alguno de los proyectos que tengo asociados a mi mail de UNSAM ahi en CGS y ya usamos eso para data/
. Si me lo confirmás ya lo hago y te paso la ruta.
Por ahí se puede poner el root en un config.yaml y llamar el path desde ahí.
Hoy los datasets se levantan desde aca.
A medida que vayamos agregando nuevos templates, vamos a consumir más bases de datos. A la hora de correr la app (ya hosteada) estaría bien centralizar toda la data en un único lugar.
Una alternativa es usar un
h5
con la data del modelo almacenada en un bucket de Google. Por ejemploY crear una función para llamarlo, así