codeforspain / datos

141 stars 5 forks source link

Acordar formatos y vocabulario con otros grupos de Open Data en España #26

Open fesja opened 8 years ago

fesja commented 8 years ago

De mis conversaciones con responsables públicos y otras organizaciones, he sacado bastante interés en que se unan esfuerzos de cara a acordar formatos y vocabularios. Asi que antes de seguir debatiendo sobre formatos, que no es el objetivo principal de Code for Spain, creo que tiene sentido tener nuestros primeros 10 datasets en un formato no perfecto.

Organizamos un grupo de trabajo junto a otras organizaciones, responsables públicos y empresas; vemos lo que hemos hecho cada uno, y nos ponemos de acuerdo. Y con ese acuerdo, ya terminamos los datasets con el formato acordado.

Si no, veo que vamos a estar debatiendo sobre si un campo si o no, uno o varios repos, cuando luego lo volveremos a debatir con otros. Como ya está sucediendo... ¿cómo lo veis?

¿Quién se apuntaría a ese grupo de trabajo? Podemos ver quiénes son los candidatos más idóneos en base a la experiencia y motivación.

fesja commented 8 years ago

Estos son los datasets del Ayuntamiento de Alcobendas que tienen normalizados según la Norma UNE 178301 Ciudades Inteligentes. Datos abiertos (Open data):

cc @inigoflores @jalbertoroman @jpaulet @calonso

inigoflores commented 8 years ago

No consigo encontrarle sentido a esta norma. He accedido a los catálogos de algunos ayuntamientos que han obtenido la certificación UNE 178301, y me encuentro que los datasets no usan una nomenclatura común, no presentan los datos en un formato unificado, y en algunos casos hasta omiten la foreign key.

Ejemplos:

Tres nombres distintos para la columna de código de barrio (TTRE_COD_BARRIO, BARRIO, TBAR_COD_BARRIO), y en la última tabla no está ni siquiera incluido.

¿Esto lo permite la norma? Lo de las tres primeras tablas pasa (incluido que se haya duplicado la columna TTRE_COD_BARRIO en la primera), pero lo de la última tabla me parece inaceptable.

Otro ejemplo: http://datos.alcobendas.org/dataset/aparcamientos-en-alcobendas/resource/a74aa5d5-7b78-42b7-a5cf-f8eb2fc1ffa2

No entiendo por qué se utilizan nombres de columna que incluyen espacios y acentos, que no pueden ser tratados por una máquina. Así mismo, no sé qué sentido tiene incluir campos para nombre de país, provincia y municipio, y sin embargo se omite el código INE del municipio.

fesja commented 8 years ago

@inigoflores he estado leyendo la norma, y no me ha aclarado mucho la verdad. Asi que esa puede ser el culpable de las diferencias de ejecución, no llega a definir nada concreto. Estoy de acuerdo contigo en que deberían llevar el código INE del municipio por ejemplo.

A ver si mañana o pasado hablo más con un par de personas y os comparto cómo podemos ayudar.