digital-guard / preserv-CO

Preservación digital de las principales fuentes de la base de datos AddressForAll-Colombia.
http://git.digital-guard.org/preserv-co
0 stars 0 forks source link

Algoritmos de limpeza de datos de Colombia adaptados en los servidores de A4A #11

Open ThierryAJean opened 2 years ago

ThierryAJean commented 2 years ago

LA idea es de adaptar los algoritmos del Batista em Node para Postgis.

0e1 commented 2 years ago

Por favor, Indicar o localização dos arquivos com os algoritmos.

ThierryAJean commented 2 years ago

@elpbatista Precisa responder para o Claiton. "Por favor, Indicar o localização dos arquivos com os algoritmos."

elpbatista commented 2 years ago

Aquí está todo https://github.com/elpbatista/address-for-all Disculpen creo recordar que copié todo eso a un repositorio de ustedes. Los scripts están orientados para obtener más datos/metadatos y agregarlos a los puntos que representan las direcciones con el fin de enriquecer la búsqueda. El código está todo en src/js y la documentación en doc/ También se incluye la lista de datos procesados y de qué archivo .shp provienen. Estoy disponible para cualquier aclaración que sea necesaria. El resto de Colombia que no son Medellín y Bogotá tienen carasterísticas un poco diferentes que en algún momento varios meses antes del proyecto estuvimos discutiendo con Freddy. Ahora mismo no encuentro dónde lo puse pero puedo volverlo a explicar si hace falta de todos modos voy a buscar mis notas para tenerlas a mano. En todos los casos la idea es, partiendo de los puntos de direcciones tratar de encontrar los demás datos a partir de operaciones espaciales básicamente punto en polígono y polígono en polígono, el resto son simples operaciones de cadena. Como los identificadores no son los mismos para todas las bases pero los puntos si son únicos notará que en algunos casos (Bogotá) para procesar en paralelo se creó un ID temporal poniendo juntas lon+lat para después combinar los resultados de ambos procesos. Para cualquier explicación detallada estoy a su entera disposición.

elpbatista commented 2 years ago

Ah, todos los sp los convertí a GeoJSON usando Qgis. Por supuesto fueron reproyectados a WGS-84 los que estaban en otra proyección correspondiente a Colombia y las coordenadas cortadas en la 6ta posición después del punto decimal ###.####### por cuestiones de eficiencia.

0e1 commented 2 years ago

Aquí está todo https://github.com/elpbatista/address-for-all Disculpen creo recordar que copié todo eso a un repositorio de ustedes.

Copiou para https://github.com/AddressForAll/WS-CO? Se copiou para WS-CO, por favor, sincronizar os repositórios.

ThierryAJean commented 2 years ago

Vamos deixar isto em stand by por enquanto, até começarmos a trabalhar na consolidação dos dados. O desfaio é pesquisar qual algoritmo utilizar para associar os pontos (na verdade pequenos vetores) das numerações prediais às ruas. Vamos também pedir para o IGAC se eles têm os nomes de rua associados aos números prediais.