Jolmed26 / PrediccionRotacionPersonal

Este repositorio explora la formulación de un modelo de rotación de personal en una empresa manufacturera para un proyecto de Tesis.
MIT License
0 stars 1 forks source link

Comentarios sobre proyecto EDA #9

Open vcuspinera opened 2 days ago

vcuspinera commented 2 days ago

Estimado Pepe. De forma global veo bien tu proyecto: el repositorio tiene la estructura adecuada, realizaste el análisis en un Jupyter notebook, divulgaste tu proyecto a través de LinkedIn y añadiste la liga en un issue del proyecto, y cumpliste con la fecha de entrega. A continuación te comparto mis comentarios para algunas secciones, con mayor detalle.

Estructura del repositorio

La estructura es adecuada y seguiste las recomendaciones del paper Good Enough Practices in Scientific Computing.

El repositorio tiene las carpetas requeridas, considerando un archivo README file en cada una, así como los archivos para citar tu repositorio, contribución y licencia.

Ortografía

Te quiero felicitar en este aspecto, no encontré ningún punto a corregir relacionado con la ortografía o gramática del proyecto.

Análisis EDA

Corrí el código de tu notebook para buscar replicar tus resultados y estos son los comentarios que fueron surgiendo a lo largo de correr el código:

Al cargar los datos en la sección 2 del notebook, utilizas una ruta absoluta y esto genera problemas a quien quiera replicar el análisis, te recomiendo utilizar una ruta relativa de acuerdo a la estructura de tu repositorio. Es decir, en vez de usar el siguiente path para leer tu data:

ruta=r'C:\Users\luism\Documents\3_Proyectos\PrediccionRotacionPersonal\data\rotacion_personal.xlsx'

…mejor utiliza el siguiente:

ruta = r'../data/rotacion_personal.xlsx'

En la descripción de datos, para el salario al correr el código aparece nan en el mínimo y máximo:

  • El rango de salario diario va de un min nan hasta nan, y su promedio es 258.79

…para evitar esto, recomendaría desaserte de NaN antes de hacer buscar los valores únicos y aplicar min/max; es decir, en vez de usar:

df['SALARIO DIARIO'].unique().min()

…utiliza lo siguiente

df['SALARIO DIARIO'].dropna().unique().min()

… por lo que al hacer este cambio para mínimo y máximo debes de tener el siguiente texto:

  • El rango de salario diario va de un min 200.0 hasta 600.0, y su promedio es 258.79

Lo mismo que se hizo para el salario diario se debería hacer para el salario mensual.

En la visualización de datos veo bien las gráficas, pero recomendaría que añadieras algunas interacciones que podrían ser interesantes y significativas para tu estudio, por ejemplo, cruzar información de tipo de renuncia con puesto y salarios promedio, para esto podrías usar mapas de calor. Para esto te pongo el código y la gráfica que se generaría con la propuesta anterior:

Código:

alt.Chart(df).mark_rect().encode(
    alt.X('PUESTO:O', title="Puesto"),
    alt.Y('Tipo de renuncia:O'),
    alt.Color('mean(SALARIO MENSUAL):Q', title="Salario mensual promedio")
).properties(
    title="Salario mensual promedio por puesto y tipo de renuncia",
    width=300,
    height=200
)

Plot:

image

Hubiera estado bien que incluyeras a final de tu análisis una sección de comentarios generales o comentarios finales.

Resultados

Me gustó mucho el resumen que hiciste en la carpeta results, me parece muy detallado y explicativo. Te recomendaría que incluyas una o dos gráficas representativas o relevantes para el análisis, como el mapa de calor al que haces referencia.

Ligas

LINK DE PROYECTO https://github.com/Jolmed26/PrediccionRotacionPersonal

DIVULGACIÓN LinkedIn https://www.linkedin.com/posts/jos%C3%A9-luis-medrano-medrano-351822124_github-jolmed26prediccionrotacionpersonal-activity-7253890433385181184-Jm_I?utm_source=share&utm_medium=member_android

Comentarios finales

Me pareció bastante bueno el análisis de la base de datos de tu tema de tesis, la estructura del proyecto es adecuada y las visualizaciones me parecieron acertadas e intuitivas. ¡Buen esfuerzo y muchas felicidades!

Saludos, Víctor Cuspinera

Jolmed26 commented 1 day ago

Estimado Maestro, muchas gracias por el nivel de atención al detalle en sus comentarios, se atendió a ellos agragando rutas relativas a los links de carga de información, visualizaciones interactivas y algunas tablas y visuales a la sección de resultados en análisis EDA y REAME.md principal.

Estos comentarios serán visibles ya en la versión final del repositorio que se nutre de las visualizaciones interactivas en Altair y un análisis de texto incluyendo los apartados de los que usted nos habló, N-grams, análisis de sentimientos y word cloud.

Nuevamente gracias por el nivel de atención al detalle puesta en su revisión y espero con esto el proyecto resulte aún más interesante de revisar y aporte más valor a quien lo haga.

Saludos, José Luis Medrano

vcuspinera commented 1 day ago

¡Muchas gracias, Pepe!

Me da gusto que mis comentarios y ambos ejercicios del curso (proyecto intermedio y final) les sirvan para tener una vision más completa de su proyecto de tesis.

Mucho éxito y sigue trabajando tan bien como lo has echo en este curso.

Estamos en contacto, saludos. Víctor