datosgobar / paquete-apertura-datos

Repositorio de ejemplos, documentación y recursos adicionales del Paquete de Apertura de Datos de la República Argentina.
https://datosgobar.github.io/paquete-apertura-datos/
50 stars 24 forks source link

Agregar recomendaciones respecto a formatos de archivos geográficos #13

Open fpetrone opened 7 years ago

fpetrone commented 7 years ago

A partir de algunas consultas y análisis de casos concretos que están surgiendo en los Planes de Apertura de diversas organizaciones que comenzaron a publicar datos geográficos, y ya que la versión 0.1 de nuestras recomendaciones no incorpora este tema, me parece que deberíamos comenzar a discutirlo.

Propongo tratar las siguientes preguntas para empezar a debatir el tema: ¿Qué formatos de archivo son los más utilizados para publicar datos geográficos? ¿Cuáles son sus ventajas y desventajas? ¿Cuál es el más recomendable? ¿Podemos establecer una escala, del más recomendado al menos?

Los formatos más difundidos sobre los que debatir, entiendo que son:

En mi opinión lo ideal sería llegar a una tabla organizada a partir de los siguientes variables: Formato; Breve descripción; Nivel de apertura; Nivel de recomendación. Espero sus contribuciones!

mcardozo commented 7 years ago

Recomendaciones para formatos de archivos geográficos

Existen dos formas de almacenar datos en un SIG: Raster o Vectorial.

El formato Raster incluye cualquier tipo de imagen digital representada en mallas (Pixels). Divide el espacio en celdas regulares donde cada una de ellas representa un único valor.

El formato Vectorial: se componen de vértices y rutas. Los tres tipos de símbolos básicos para datos vectoriales son puntos, líneas y polígonos.

Considerando que los formatos vectoriales son los más utilizados se describe a continuación los más populares, ordenándolos de los más utilizados a los menos comunes.

Formatos vectoriales más populares

  1. Shapefiles Formato más popular y extendido. Se puede leer con la mayoría de los software Gis. El shapefile no es un único archivo, lo cual es una desventaja, se compone de varios. El mínimo requerido es de tres:

    .shp – almacena las entidades geométricas de los objetos.
    .shx – almacena el índice de las entidades geométricas.
    .dbf – tabla dBASE donde se almacenan los atributos de los elementos geométricos.
    
    Opcionalmente puede tener un .prj, .sbn, .sbx, .fbn, .fbx .ain, .aih, .shp.xml.
  2. CSV / GeoCSV CSV: Representa datos en forma de tabla. Sirve para almacenar información alfanumérica con la posibilidad de almacenar las coordenadas y posteriormente podemos crear una capa. GeoCSV: Es un nuevo formato y es una especificación del formato de archivo tabular CSV con una extensión opcional de geometría. Puede tener archivos auxiliares como CSVT, PRJ, CSVZ. Lo cual puede ser una desventaja.

  3. GML / XML GML (Geography Markup Language) es el estándar XML de la OGC (organización que define los estándares abiertos) para representar información de elementos espaciales. El formato de intercambio de los metadatos es XML (eXtensible Markup Language) – lenguaje de marcas extensible.

  4. GeoPackage GeoPackage es un formato de archivo universal para compartir y transferir datos espaciales vectoriales y raster. Es por tanto la alternativa nueva a formatos como el GeoTIFF(raster) y especialmente el Shapefile.

  5. GeoJson
    GeoJSON (Javascript Object Notation) es un formato de texto que es muy rápido de analizar en máquinas virtuales Javascript.

  6. KML/KMZ Aunque desarrollado para Google Earth, desde el año 2008 KML es estándar de la OGC (Open Geospatial Consortium) también es muy popular y ha hecho que se ha democratizado mucho. KML significa Keyhole Markup Language, y es un lenguaje de marcado basado en XML para representar datos geográficos en tres dimensiones.

Nota: existen otros formatos populares tales como Arc/Info, DWG/DXF/DGN, pero que solo son compatibles por sistemas específicos como Autocad y arcGis que son pagos.