Hola, Josué.
De forma global veo bien tu proyecto: el repositorio del proyecto tiene la estructura adecuada, realizaste el EDA en Jupyter notebook, compartiste el link del proyecto en el repositorio del curso, agregaste un issue con los pendientes del proyecto sobre la relación de variables, la entrega se realizó antes del deadline. Sin embargo, no compartiste la información sobre el medio de divulgación del proyecto.
A continuación te comparto mis comentarios para algunas secciones, con mayor detalle.
En el archivo README.md en la carpeta principal del repositorio se incluyó la descripción general del proyecto, un resumen de resultados y la liga del Jupyter notebook con el análisis EDA.
Análisis EDA
Revisé el Jupyter notebook para buscar replicar tus resultados y estos son los comentarios que fueron surgiendo al correr el código:
Cuando mandas llamas la base de datos utilizas una ruta absoulta a tu equipo de cómputo y no una ruta relativa (ésta última es la que deberías usar). Es decir, en el lugar de usar el siguiente código:
En la descripción de los datos me pareció muy bien que, además del análisis, incluyeras una breve descripción de las variables (columnas de la base de datos).
Cuando consultas la información, resaltan los pesos de los peleadores los cuales están en libras. Dado que en México no estamos familiarizados con esta unidad de medida, te recomendaría tener una columna donde calculara el peso de los individuos en Kg. para que pueda tener más sentido el leer la información.
El tratamiento que le diste a los valores nulos me pareció adecuado, dado que tomaste decisiones con base en la variable (por ejemplo, rellenar con ceros o con otros valores).
En la última gráfica que compartes donde se compara la edad con las victorias profesionales MMA, vi bien la gráfica de burbujas, aunque me parece más adecuada una gráfica de calor (o heatmap), para la cual podría cambiar tu código para que quedara de la siguiente manera:
alt.Chart(metacritic).mark_rect().encode(
alt.X('mma_wins:O', title='Victorias profesionales en MMA'),
alt.Y('age:O', title='Edad'),
alt.Color('sum(mma_loses):Q', title='Sumatoria de Derrotas profesionales en MMA')
).properties(title='Grafico de calor')
Comentarios finales
Me pareció completo el análisis con datos de peleadores de la UFC. La estructura del repositorio, el análisis, visualizaciones y comentarios me parecieron adecuados. Además, me parece que hiciste un buen esfuerzo utilizando la librería de Altair para graficar una buena parte de la información. ¡Muy buen esfuerzo y muchas felicidades!
Hola, Josué. De forma global veo bien tu proyecto: el repositorio del proyecto tiene la estructura adecuada, realizaste el EDA en Jupyter notebook, compartiste el link del proyecto en el repositorio del curso, agregaste un issue con los pendientes del proyecto sobre la relación de variables, la entrega se realizó antes del deadline. Sin embargo, no compartiste la información sobre el medio de divulgación del proyecto.
A continuación te comparto mis comentarios para algunas secciones, con mayor detalle.
Estructura del repositorio
La estructura es adecuada y seguiste las recomendaciones del paper Good Enough Practices in Scientific Computing.
En el archivo README.md en la carpeta principal del repositorio se incluyó la descripción general del proyecto, un resumen de resultados y la liga del Jupyter notebook con el análisis EDA.
Análisis EDA
Revisé el Jupyter notebook para buscar replicar tus resultados y estos son los comentarios que fueron surgiendo al correr el código:
Cuando mandas llamas la base de datos utilizas una ruta absoulta a tu equipo de cómputo y no una ruta relativa (ésta última es la que deberías usar). Es decir, en el lugar de usar el siguiente código:
…recomendaría utilizar el código:
En la descripción de los datos me pareció muy bien que, además del análisis, incluyeras una breve descripción de las variables (columnas de la base de datos).
Cuando consultas la información, resaltan los pesos de los peleadores los cuales están en libras. Dado que en México no estamos familiarizados con esta unidad de medida, te recomendaría tener una columna donde calculara el peso de los individuos en Kg. para que pueda tener más sentido el leer la información.
El tratamiento que le diste a los valores nulos me pareció adecuado, dado que tomaste decisiones con base en la variable (por ejemplo, rellenar con ceros o con otros valores).
En la última gráfica que compartes donde se compara la edad con las victorias profesionales MMA, vi bien la gráfica de burbujas, aunque me parece más adecuada una gráfica de calor (o heatmap), para la cual podría cambiar tu código para que quedara de la siguiente manera:
Comentarios finales
Me pareció completo el análisis con datos de peleadores de la UFC. La estructura del repositorio, el análisis, visualizaciones y comentarios me parecieron adecuados. Además, me parece que hiciste un buen esfuerzo utilizando la librería de Altair para graficar una buena parte de la información. ¡Muy buen esfuerzo y muchas felicidades!
Saludos, Víctor Cuspinera