datosgobar / georef-ar-api

API del Servicio de Normalización de Datos Geográficos de Argentina.
https://apis.datos.gob.ar/georef
MIT License
153 stars 35 forks source link

Crear tabla de dirección para probar la normalización #146

Closed nsampi closed 5 years ago

nsampi commented 6 years ago

Crear tabla con:

direccion_original calle_original altura_original localidad_original departamento_original provincia_original lat_original lon_original direccion_normalizada calle_normalizada altura_normalizada localidad_normalizada departamento_normalizada provincia_normalizada lat_normalizada lon_normalizada

federicotdn commented 6 years ago
__________________________
# Tipeo textual

direccion_original
provincia_original
localidad_original
departamento_original
barrio_original

lat_original
lon_original

origen_provincia
origen_departamento

dataset_id
entry_date
____________________________
# Identificar componentes
calle1_
calle2_
calle3_
altura_
unidades_
_______________________
# Valores normalizados

calle1_
calle2_
calle3_
altura_

localidad_normalizada
departamento_normalizada
provincia_normalizada

lat_normalizada
lon_normalizada
federicotdn commented 6 years ago

Con @ebernatene decidimos que la estructura final de la tabla va a ser la siguiente:

1) Sección de tipeo textual

Se agregan los datos crudos intentando lograr la mejor correspondencia posible entre el esquema de los datos provenientes y las columnas con sufijo _original. De ser necesario, se puede agregar nuevas columnas.

Los campos origen_provincia y origen_departamento pueden ser completados en caso de saber dónde fueron generados los datos. Esta información puede resultar útil a la hora de buscar la ubicación real de una dirección (por contexto).

El campo dataset_id debe contener un valor que indique cuál es el origen de los datos (e.g. el nombre de un archivo). El campo entry_date contiene la fecha en la que se ingresaron los datos en la tabla.

2) Sección de identificado de componentes

Se realiza una interpretación del campo direccion_original y se vuelcan los resultados en los campos calle1, calle2, calle3, altura, unidades.

La forma de utilizar cada campo es la siguiente, dependiendo del valor de direccion_original:

Cualquier otro dato adicional que aparezca en el campo direccion_original es ignorado (barrio, edificio, etc.).

3) Sección de normalizado

Se cuentan con los campos que corresponden a una respuesta de una llamada a la API utilizando los datos ingresados (recurso /provincias).

nsampi commented 5 years ago

@ebernatene en que quedo este issue? La tabla ya esta creada?

ebernatene commented 5 years ago

Esta listo, quizas tenga que volver a correr algo para incluir las nuevas listas que sume o las variaciones que hice de las funciones, pero esta lista

El lun., 10 dic. 2018 a las 15:56, Natalia Sampietro (< notifications@github.com>) escribió:

@ebernatene https://github.com/ebernatene en que quedo este issue? La tabla ya esta creada?

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub https://github.com/datosgobar/georef-ar-api/issues/146#issuecomment-445929849, or mute the thread https://github.com/notifications/unsubscribe-auth/Ah54_oFrk-ZmtqURKscoJjpe82RcztRfks5u3q5HgaJpZM4Xgtz2 .