Open iaga opened 5 years ago
Este es el issue asociado a la capa de número de días sin agua @aleestrada
Se siguen los pasos del código asignacion_col_id.Rmd
(en \CARPETAS_TRABAJO\amedina\MEGADAPT) y se adaptan para procesar los datos del año 2017 en FUGAS_FALTAS Y EFICIENCIA ANIOS 2017 Y 2018.xlsx
:
FECHA
y CALLE
), se crea la columna "MUNICOLO_OBS" y se calculan los días sin agua (dias_sin_agua
) con base en la diferencia entre la fecha del reporte y la fecha de solución. col_ageb.csv
, que contiene el nombre de las colonias, y delegaciones.csv
, que contiene el nombre de las delegaciones, además de algunas faltas ortográficas encontradas), que genera la columna MUNICOLO_ORIG
(en \CARPETAS_TRABAJO\amedina\dias_sagua_reportes\filtro_python.py)MUNICOLO_ORIG
y MUNICOLO
y se calcula el coeficiente de similitud; se corta en un coeficiente ≥ 0.7 (sin una revisión exhaustiva se decidió que a partir de este punto los errores eran mínimos, además de que se conserva el 95.74% de los datos)Se calcula media, mediana y número de reportes por colonia de la base depurada y se une (por COL_ID
) con la capa que contiene la información geográfica de colonias (col_id
, en \CARPETAS_TRABAJO\amedina\dias_sagua_reportes\insumos\colonias). Debido a que en la base original no existen registros de reportes para algunas colonias, se decidió asignarles ceros (en media, mediana y número de reportes) a estas; sin embargo, y con el fin de no conservar la información original, se creó la columna is_na
que indica si los ceros en media y mediana de la colonia son asignados o provienen del procesamiento de la base.
Finalmente, se escribe la capa dias_sin_agua_2017_v3.shp
con la información anterior.
Se utiliza la función apc.colonia_ageb
de la librería apc
para pasar los registros de colonias a AGEB's.
Archivo faltas_dias_2017_v3.csv
, que contiene la base depurada y con el col_id de cada uno de los registros.
En \CARPETAS_TRABAJO\amedina\dias_sagua_reportes\insumos
Capa dias_sin_agua_2017_v3.shp
que sirve de entrada para el downscaling, la capa tiene los campos:
Capa tp_dsa_agebs_cdmx.shp
que contiene el resultado del downscaling (la asignación de ageb_id's); contiene los mismos campos que la capa anterior.
En \CARPETAS_TRABAJO\amedina\dias_sagua_reportes\salida
Autores: @iaga y @aleestrada
Debido a que la capa obtenida tp_dsa_agebs_cdmx.shp
genera como valor máximo 521.44 días sin agua en promedio (casi el doble del máximo calculado por colonia, 294.67), se citó a una reunión de trabajo el día 28/02/2019 a las 9:30 am para ubicar las causas de la generación de dicho número.
tp_dsa_agebs_cdmx.shp
Después de una revisión detallada de la capa se encontró que el problema de la inflación de las medias se debe a dos factores:
La siguiente imagen ejemplifica dicho problema (las agebs se encuentran coloreadas y las líneas punteadas representan los límites de las colonias):
Se pude observar que la ageb en negro intersecta con 4 colonias (de hecho contiene dos colonias completas), por lo que la media de estas es una combinación de las medias de las 4 colonias.
Después de descubierto el problema se propusieron dos alternativas:
area_new: Cambiar ligeramente la ponderación hecha por el downscaling, usando el área total de la ageb en lugar del área de la colonia
intersect: Utilizar las funciones de Qgis para unir atributos según su localización
Se modificó ligeramente la función colonia_ageb
de la librería apc con el fin de que se hiciera la ponderación por la proporción entre el área de la ageb que intersecta con el área de una colonia y el área total de la ageb (en lugar del área total de la colonia); sólo fue necesario modificar una línea de código.
El mapa generado es el siguiente:
Se utilizó la herramienta de gestión de datos de Qgis "Unir atributos por localización", que combina los atributos de una capa (la media de días sin agua en este caso) con la información de localización de otra capa (de agebs en este caso).
El mapa generado es el siguiente:
NOTA: Los cortes presentados en los mapas se definieron según la escala de Weber-Fechner, y usando el archivo WEBER 2.xls
, en \CARPETAS_TRABAJO\amedina\dias_sagua_reportes
Las capas tp_dsa_agebs_cdmx_v3.shp
(area_new) y tp_intersect_dsa_agebs_cdmx.shp
(intersect) se encuentran en \CARPETAS_TRABAJO\amedina\dias_sagua_reportes\salida
Los mapas presentados se encuentran en \CARPETAS_TRABAJO\amedina\dias_sagua_reportes\salida\mapas
A continuación se muestran dos gráficos creados para explorar la distribución de las media de días sin agua a nivel colonia. La primera imagen muestra la distribución con los datos de la base original (hay que recordar que existen colonias que no tienen registros en dicha base). La segunda gráfica se generó a partir de la base que contiene los ceros asignados a las colonias que no se encontraban en la base original.
Con el fin de hacer una comparación entre los métodos empleados para pasar de nivel colonia a nivel ageb, también se generaron un par de gráficos para explorar las distribuciones de días sin agua bajo cada alternativa y comparar ambas con la distribución a nivel colonia.
Esta alternativa parece capturar de mejor manera "las" distribuciones en los datos (las jorobas en cero y 100).
También parece capturar las dos distribuciones presentes en los datos, pero la sub-estimación de ceros aunque extraño se parece a los datos originales (sin los ceros asignados).
Todas las gráficas se encuentran al final del script faltas_dias_2017.Rmd
en \CARPETAS_TRABAJO\amedina\dias_sagua_reportes
Debido a que el número de reportes es una frecuencia, se considera pertinente el uso del downscaling original (tal y como se encuentra en la función colonia_ageb
de la librería apc
).
NOTA: Los cortes presentados en los mapas se definieron según la escala de Weber-Fechner.
La capa se encuentra en \CARPETAS_TRABAJO\amedina\dias_sagua_reportes\salida
Pendientes:
Es necesario eliminar de la capa tp_dsa_agebs_cdmx_v3.shp:
Generar una capa que contenga el número de días sin agua por AGEB a partir de los reportes de faltas para el año 2017. Esta capa se utilizará como insumo para el índice de grado de protesta (issue #100)
Carpeta en la que se encuentran los datos:
\CARPETAS_TRABAJO\amedina\dias_sagua_reportes
Insumos:
Salidas:
.csv
que contiene el número de días sin agua por coloniaProcedimiento:
markdown
que contenga el preprocesamiento de los datos para pasar de la base de datos de reportes a un archivo.csv
que contenga los reportes por colonia, por delegación (Es necesario realizar el promedio para los reportes repetidos)