Open vcuspinera opened 6 days ago
Muchas gracias maestro!
El mié, 27 nov 2024 a las 1:17, Victor Cuspinera-Contreras (< @.***>) escribió:
Estimado Octavio. De forma global veo bien tu proyecto: el repositorio tiene la estructura adecuada, realizaste el análisis en un Jupyter notebook, divulgaste tu proyecto a través de X (antes Twitter) y añadiste la liga en un issue del proyecto, y cumpliste con la fecha de entrega. A continuación te comparto mis comentarios para algunas secciones, con mayor detalle. Estructura del repositorio
La estructura es adecuada y seguiste las recomendaciones del paper Good Enough Practices in Scientific Computing https://github.com/vcuspinera/UDG_MCD_Project_Dev_I/blob/main/actividades/material/02%20Good%20Enough%20Practices%20Sc%20Computing.pdf .
El repositorio tiene las carpetas requeridas, considerando un archivo README file en cada una, así como los archivos para citar tu repositorio, contribución y licencia. Ortografía
Encontré algunos puntos por corregir relacionados con la ortografía, gramática o algunos datos, entre ellos, en el README de la carpeta raíz pusiste que el análisis cuenta con 116,00 registros pero supongo que deberían ser 116,000, así como la palabra contrinuir en vez de contribuir. Análisis EDA
En el README de la carpera src mencionas que tu archivo de trabajo no es un jupyter notebook sino un archivo de Visual Studio Code; yo creo que aquí hay una confusión, ya que el archivo Visual.ipynb sí es un Jupyter notebook el cual se puede trabajar, editar y correr desde Visual Studio Code sin probema. A manera de referencia te comparto la siguiente liga: How To Open .Ipynb File (Jupyter Notebook) https://digitalhumanities.hkust.edu.hk/tutorials/how-to-open-ipynb-file-jupyter-notebook/#:~:text=ipynb%20stands%20for%20%E2%80%9CInteractive%20Python,file%20format%20of%20Jupyter%20Notebook.
Por otro lado, corrí el código de tu notebook para buscar replicar tus resultados y estos son los comentarios que fueron surgiendo:
Al intentar leer los datos, te faltó considerar que éstos se encuentran en la carpeta data, por lo que para leer tu CSV tendrías que compartir la ruta correcta:
school_data = pd.read_csv('../data/Connect.csv', sep = ',')
Para que tu análisis fuera más claro, debería utilizar bloques de markdown para añadir título del documento y de las secciones, así como hacer comentarios sobre tu código y los resultados, lo cual es muy relevante en el análisis como data scientist.
Al correr el código lm.score(X,Y) me muestra un error.
Durante el análisis no me parece claro porqué tienes una variable que se llama school_data y otra data_school, esto puede ser confuso.
Suponiendo que tu base de datos final es la que se llama school_data porque la utilizas para graficar, me parece que deberías hacer una limpieza de esta base de datos ya que contiene unas columnas que inician con Unnamed y otras que parece que se repiten, por ejemplo, las columnas Periodo y Periodo.1.
Las gráficas las veo bien, pues sin interesantes y autodescriptivas, con título de cada gráfica y nombres en los ejes; deberías añadir una breve explicación de las gráficas similar a lo que os platicaste durante la presentación de tus resultados.
No me queda claro cuál variable se refiere a la deserción del alumno.
Como tu mayor interés es obtener más información de de la deserción, sería bueno cruzar/comparar la información de si el alumno desertó con otra información como las calificaciones el número de años que estuvo, la carrera que estaba estudiando, etc.
Además, hubiera estado bien que incluyeras a final de tu análisis una sección de comentarios finales y referencias. Resultados
Vi que en la carpeta de results añadiste una descripción de tu proceso y resultados, sin embargo, deberías de añadir una descripción a lo largo de tu análisis en el notebook. Ligas
LINK DE PROYECTO
https://github.com/OctavioMendoza/Estudio-de-la-Desercion-en-el-TecMM-Chapala
DIVULGACIÓN X https://x.com/Octaviomendoza3/status/1848114061621313701 Comentarios finales
Me pareció bastante bien el análisis de la base de datos de tu tema de tesis, la estructura del proyecto es adecuada y las visualizaciones me parecieron acertadas e intuitivas, aunque faltó añadir una explicación en tu notebook del EDA. ¡Buen esfuerzo y muchas felicidades!
Saludos, Víctor Cuspinera
— Reply to this email directly, view it on GitHub https://github.com/OctavioMendoza/Estudio-de-la-Desercion-en-el-TecMM-Chapala/issues/2, or unsubscribe https://github.com/notifications/unsubscribe-auth/BCEEN3XRLLBE6SXQWKNNXAT2CVWXFAVCNFSM6AAAAABSSEH7Z6VHI2DSMVQWIX3LMV43ASLTON2WKOZSGY4TONBRGI4TCMI . You are receiving this because you are subscribed to this thread.Message ID: <OctavioMendoza/Estudio-de-la-Desercion-en-el-TecMM-Chapala/issues/2@ github.com>
Estimado Octavio. De forma global veo bien tu proyecto: el repositorio tiene la estructura adecuada, realizaste el análisis en un Jupyter notebook, divulgaste tu proyecto a través de X (antes Twitter) y añadiste la liga en un issue del proyecto, y cumpliste con la fecha de entrega. A continuación te comparto mis comentarios para algunas secciones, con mayor detalle.
Estructura del repositorio
La estructura es adecuada y seguiste las recomendaciones del paper Good Enough Practices in Scientific Computing.
El repositorio tiene las carpetas requeridas, considerando un archivo README file en cada una, así como los archivos para citar tu repositorio, contribución y licencia.
Ortografía
Encontré algunos puntos por corregir relacionados con la ortografía, gramática o algunos datos, entre ellos, en el README de la carpeta raíz pusiste que el análisis cuenta con
116,00 registros
pero supongo que deberían ser116,000
, así como la palabracontrinuir
en vez decontribuir
.Análisis EDA
En el README de la carpera
src
mencionas que tu archivo de trabajo no es un jupyter notebook sino un archivo de Visual Studio Code; yo creo que aquí hay una confusión, ya que el archivoVisual.ipynb
sí es un Jupyter notebook el cual se puede trabajar, editar y correr desde Visual Studio Code sin probema. A manera de referencia te comparto la siguiente liga: How To Open .Ipynb File (Jupyter Notebook)Por otro lado, corrí el código de tu notebook para buscar replicar tus resultados y estos son los comentarios que fueron surgiendo:
Al intentar leer los datos, te faltó considerar que éstos se encuentran en la carpeta
data
, por lo que para leer tu CSV tendrías que compartir la ruta correcta:Para que tu análisis fuera más claro, debería utilizar bloques de markdown para añadir título del documento y de las secciones, así como hacer comentarios sobre tu código y los resultados, lo cual es muy relevante en el análisis como data scientist.
Al correr el código
lm.score(X,Y)
me muestra un error.Durante el análisis no me parece claro porqué tienes una variable que se llama
school_data
y otradata_school
, esto puede ser confuso.Suponiendo que tu base de datos final es la que se llama
school_data
porque la utilizas para graficar, me parece que deberías hacer una limpieza de esta base de datos ya que contiene unas columnas que inician conUnnamed
y otras que parece que se repiten, por ejemplo, las columnasPeriodo
yPeriodo.1
.Las gráficas las veo bien, pues sin interesantes y autodescriptivas, con título de cada gráfica y nombres en los ejes; deberías añadir una breve explicación de las gráficas similar a lo que os platicaste durante la presentación de tus resultados.
No me queda claro cuál variable se refiere a la deserción del alumno.
Como tu mayor interés es obtener más información de de la deserción, sería bueno cruzar/comparar la información de si el alumno desertó con otra información como las calificaciones el número de años que estuvo, la carrera que estaba estudiando, etc.
Además, hubiera estado bien que incluyeras a final de tu análisis una sección de comentarios finales y referencias.
Resultados
Vi que en la carpeta de
results
añadiste una descripción de tu proceso y resultados, sin embargo, deberías de añadir una descripción a lo largo de tu análisis en el notebook.Ligas
LINK DE PROYECTO https://github.com/OctavioMendoza/Estudio-de-la-Desercion-en-el-TecMM-Chapala
DIVULGACIÓN X https://x.com/Octaviomendoza3/status/1848114061621313701
Comentarios finales
Me pareció bastante bien el análisis de la base de datos de tu tema de tesis, la estructura del proyecto es adecuada y las visualizaciones me parecieron acertadas e intuitivas, aunque faltó añadir una explicación en tu notebook del EDA. ¡Buen esfuerzo y muchas felicidades!
Saludos, Víctor Cuspinera