Rebeca98 / radiografia-RepMexicana

0 stars 0 forks source link

Propuesta de Proyecto

Estadística Aplicada 3

Radiografía de la República Mexicana

Motivación

Entre los 32 estados que componen la República Mexicana hay una enorme diversidad. Algunos estados son más similares que otros: existen enormes brechas de desigualdad, diferentes estándares de seguridad y accesos a servicios básicos. ¿Cómo se vería entonces una foto de la República? ¿Quién se parece a quién? ¿Cómo es el nivel de vida en los estados? ¿Hay algún factor geográfico o cultural que haga a algunos estados distintos de otros? Estas son algunas de las preguntas que busca contestar nuestro proyecto, con miras a comprender la situación actual del país, y a construir alguna medida de “calidad de vida” para cada estado.

Alcance

utilizamos el siguiente grupos de variables:

Con estas buscamos resumir la situación del país, buscar países similares y finalmente generar algún tipo de índice de calidad de vida.

Resultados

En primer lugar, un resumen gráfico y con estadísticos numéricos sobre la situación del país (cómo se compara cada estado vs el promedio, índices de seguridad, pobreza, etc.). Luego, una agrupación de los estados de la república, de la mano de variables generadas a través de métodos estadísticos, que describan a estos clusters. Finalmente, un índice de calidad de vida que utilice todas (o varias) de estas variables.

Actividades

Recolección de datos de fuentes como CONEVAL, INEGI, BANXICO, Banco Mundial, etc. Análisis exploratorio inicial para comprender la estructura de los datos y comenzar a buscar patrones. Aquí explotaremos lo aprendido sobre visualización multivariada y sobre análisis exploratorio. Reducción de dimensionalidad a través de componentes principales, para tratar también de resumir los indicadores múltiples en “grupos” y trabajar con menos variables. Clustering de los estados, a través de alguna técnica de dimensionalidad alta o según lo que arroje la reducción de dimensionalidad. Aquí también se estudiará la relación entre algunas variables según los clusters (por ejemplo, localización geográfica y tamaño vs productividad o seguridad) a través de análisis de correlación canónica. Generación de un índice de calidad de vida, ya sea a través del análisis de factores, o de componentes principales, según lo que arroje el análisis previo.