lchittaro-old / preciosconstantes

Serie de precios constantes del comercio exterior argentino 1993-2013
http://lchittaro.github.io/preciosconstantes/
1 stars 0 forks source link

Subir la base de datos al repositorio en XLSX y en CSV #4

Open abenassi opened 8 years ago

abenassi commented 8 years ago

Dado el tamaño que me comentaste que tiene la base de datos, cambio mi recomendación anterior de usar Dropbox por subirla al repo en Github! Ya que te tomaste el laburo de entrar en el mundo Github, es mucho más lógico, seguro, estable y copado que simplemente subas la base a este mismo repo :-)

Yo subiría dos versiones: en excel, que es lo que muchísimos usuarios usan, y en csv que es un formato abierto. Fijate que desde excel podés guardar en CSV si la tabla está bien hecha, aunque pueden surgir algunos errores porque excel no es muy bueno lidiando con formatos abiertos. Si necesitás una mano con eso lo vemos, pero de movida subí la base acá y linkeá al archivo alojado en Github para poner en el blog o donde sea.

lchittaro commented 8 years ago

tengo que refinar un par de cosas en la base, para poder tener una mejor presentación en tablau. El tema es que Alberto me pidió que los filtros tuvieran una mayor apertura, tipo estructura en árbol (y que pueda elegir por ejemplo Agro--Cereales--Soja o lo mismo pero en dígitos del clasificador 0---01---0123). Pero yo tengo los registros de la base solo con la categoría del producto a 4 dígitos, por lo que no se si agregarle columnas a la base (ej: Soja | 0123 | 012 | 01 | 0), con lo cual crecería geométricamente la base, o encontrar alguna forma de que tableau reconozca la estructura del clasificador (bases anidadas quizas?) Busco un poco y te cuento

abenassi commented 8 years ago

Buscá un poco tal vez, de todas maneras mi recomendación a priori es que crees las columnas que haga falta. Es la forma más directa y sencilla y no creo que te aumente mucho el tamaño de la base (no crece geométricamente, sólo le hacés un "split" al código del producto en 4 columnas, para poder operar cada nivel de agregación por separado).

El 7 de abril de 2016, 16:50, lchittaro notifications@github.com escribió:

tengo que refinar un par de cosas en la base, para poder tener una mejor presentación en tablau. El tema es que Alberto me pidió que los filtros tuvieran una mayor apertura, tipo estructura en árbol (y que pueda elegir por ejemplo Agro--Cereales--Soja o lo mismo pero en dígitos del clasificador 0---01---0123). Pero yo tengo los registros de la base solo con la categoría del producto a 4 dígitos, por lo que no se si agregarle columnas a la base (ej: Soja | 0123 | 012 | 01 | 0), con lo cual crecería geométricamente la base, o encontrar alguna forma de que tableau reconozca la estructura del clasificador (bases anidadas quizas?) Busco un poco y te cuento

— You are receiving this because you authored the thread. Reply to this email directly or view it on GitHub https://github.com/lchittaro/preciosconstantes/issues/4#issuecomment-207064418

lchittaro commented 8 years ago

Hice todo esto, pero ahora no se como copiar el link para que sea una descarga directa del archivo csv. Con el xslx todo bien, abrí donde estaba ubicado en el repo y copié el link de raw data, que te lo descarga, pero con el csv se abre en el explorador y no lo descarga de una.

abenassi commented 8 years ago

Hmmm sí, estuve buscando y no encuentro bien cómo. Obviamente uno puede hacer click derecho sobre el link y poner "Save link as..." para descargarlo, pero estaría bueno que lo puedas hacer de entrada.

Mientras te doy otros puntos de feedback:

abenassi commented 8 years ago

Acá te paso también otros estándares de publicación de datos que sigue el Portal de Datos Abiertos: https://github.com/gobabiertoAR/documentacion-estandares/tree/master/datos/publicacion

Es un trabajo en progreso, pero eventualmente apuntamos a que sirvan de guía para que los datasets se publiquen siempre siguiendo algunos lineamientos, y sea más fácil utilizarlos por cualquier persona.