LLop8029 / Encuesta-de-Satisfacci-n

Creación del repositorio para el Análisis Exploratorio de Datos (EDA)
MIT License
0 stars 0 forks source link

Comentarios sobre proyecto EDA #2

Open vcuspinera opened 1 year ago

vcuspinera commented 1 year ago

Hola, Larisa. Mis comentarios generales de tu proyecto son los siguientes: el repositorio del proyecto tiene la estructura adecuada, realizaste el EDA en Jupyter notebook (aunque lo compartiste en PDF y no como Jupyter notebook por lo que no puedo replicar tu análisis), compartiste el link del proyecto en el repositorio del curso, divulgaste tu proyecto (me parece que en Whatsapp e Instagram, pero no pude ver esta publicación), incluiste un issues con los pendientes del proyecto y cumpliste con la fecha de entrega. A continuación te comparto mis comentarios para algunas secciones, con mayor detalle.

Estructura del repositorio

La estructura en general es adecuada de acuerdo al paper Good Enough Practices in Scientific Computing.

Sin embargo, en esta estructura faltó poner la descripción en el README file de la carpeta doc. No incluiste el Jupyter notebook con el análisis EDA, sino una versión en PDF de éste documento, por lo cual no pude replicar el análisis. Sobre los resultados, recomendaría que subieras los resultados como un Markdown en vez de un archivo PDF. Otro comentario es que la carpeta con la información se debe llamar data (o en su caso datos) en vez de date (que significa “fecha” en inglés).

En el README file del directorio raíz del repositorio recomendaría cambiar el título de “Encuesta-de-Satisfacci-n” a “Encuesta de satisfacción”. Además, en este archivo README.md se incluyó la descripción general del proyecto, aunque no me es claro si la encuesta se realizó a usuarios, personal en genera o médicos del IMSS; sin embargo, no se compartió un breve resumen de resultados, ni la ubicación del análisis EDA en un Jupyter notebook.

Análisis EDA

Como lo comenté anteriormente, no incluiste el Jupyter notebook con el análisis EDA, sino una versión en PDF de éste documento, por lo cual no pude replicar el análisis.

Cuando cargas las bases de datos haces referencia a que el archivo está en la misma carpeta que el Jupyter notebook, pero considerando que el análisis debería estar en la carpeta src y la base de datos en la carpeta data entonces deberías tener el siguiente código:

# Cargando la base de datos 
date=pd.read_csv('../data/ENSat-2016-jul-2doNivel.csv',index_col=0, encoding='latin-1')

Por otro lado, me parece muy bien que hayas complementado el análisis de los datos de cada variable con una explicación de qué significa cada código, esto hace más transparente el análisis.

Cuando eliminas algunas de las variables faltó poner el criterio por el que decidiste eliminar las variables ya que algunas podrían ser importantes como satprocref la cual dice “En general ¿qué tan satisfecho está con el proceso que tuvo que seguir para acudir a consulta con el especialista en este hospital?” y podría ser relevante.

Hay algunas variables numéricas como probsal y motoper relacionadas con problemas de salud y tipo de operación, respectivamente, que realmente cada uno de los números a los que hacen referencia se relaciona con un término y no una medición. Por ejemplo, para la variable probsal el valor de 1 hace referencia a “Diabetes Mellitus”, 2 a “Hipertensión arterial”, 3 a “Control de embarazo”, etc. Por lo anterior, no puedes tratar este tipo de variables como cuantitativas sino como categóricas. Es importante estudiar y conocer los datos para poder saber cómo tratarlos.

De hecho por eso en la gráfica de tiempo promedio por cada motivo de operación algunas series de tiempo tienen mucha variación.

Por otro lado, encontré algunos errores de ortografía, por ejemplo, en el título del PDF del notebook aparece la palabra “Poryecto” en vez de “Proyecto”.

Comentarios finales

Me pareció interesante la idea de tu proyecto analizando la encuesta de satisfacción. Falta ser un poco más clara sobre la información utilizada como cuál fue la población objetivo de la encuesta (usuarios o trabajadores del IMSS), así como incluir el Jupyter notebook del análisis EDA y no una versión en PDF para que cualquier persona pueda replicar el análisis. Por otro lado recomendaría tener cuidado y seguir las indicaciones de lo solicitado para este proyecto. ¡Buen esfuerzo! Espero que lo que has aprendido en este proyecto te sirva para mejorar tu análisis y estructuración de tus proyectos.

Saludos, Víctor Cuspinera

vcuspinera commented 1 year ago

Link proyecto

https://github.com/LLop8029/Encuesta-de-Satisfacci-n

Divulgación por redes sociales:

⚠️ Recomendaría compartir esto en redes sociales de índole profesional como LinkedIn o, al menos, en X (antes Twitter); otra alternativa es publicarlo en revistas digitales como Medium o Towards Data Science.