Closed MRocioG closed 9 months ago
24/11/2023
¿cómo nos encontramos?
1_ resumen sesión anterior
creación de repositorio definimos working agreements
2_ avances/retos/stoppers
se creó el repositorio en carpeta propia --> se borró creación del proyecto en el repositorio con fases en calendario documentación de los Working Agreements draft - documentación de la estructura del repositorio, según indicaciones (esqueleto) draft - documentación de la estructura del readme, según indicaciones (esqueleto)
3_ plan para hoy calendario de trabajo pedir ayuda para borrar el repo Adalab-project-da-promo-F-module-3-team-6 (creado por error)
27/11/2023
¿cómo nos encontramos?
1_ resumen sesión anterior calendario de trabajo vamos amoldándonos Borrado el repo Adalab-project-da-promo-F-module-3-team-6 (creado por error @MRocioG - Ana nos ayudó). Se borraron tarjetas y se volvieron a crear. realizamos análisis de la tabla entre las cuatro Hemos acordado mantener el texto en columna BusinessTravel, en el futuro evaluaremos si cambiamos por INT No modificamos las tablas aún Hemos repartido las columnas. Enfocamos la solución para la transformación de los datos viable. Reparto: Marta 1-10 y 41 Lucia 11-20 Marga 21-30 Rocio 31-40
2_ avances/retos/stoppers Revisar columna por columna Dudas sobre los valores de los datos --> preguntaremos al cliente cuando tengamos visión más holística (Ana) Creación de la tabla info_df_HR_RAW_DATA.xlsx: fichero colaborativo
3_ plan para hoy evaluamos cuánto tiempo y cuántas columnas hemos podido hacer estos días. creamos tabla @MRocioG sube info_df al drive y comparte
28/11/2023
¿cómo nos encontramos?
1_ resumen sesión anterior
2_ avances/retos/stoppers
Dudas sobre los valores de los datos --> preguntaremos al cliente cuando tengamos visión más holística (Ana)
Dudas sobre la interpretación de algunos datos (satisfacción: 1 es mucho o poco, 4 es mucho o poco¿?)
cómo pasar el df_HR.info() a excel? ==> no se puede (a ver, se puede pero no separa en columnas, habría q insertar todos los datos de manera manual)
3_ plan para hoy Seguir el análisis de la tabla, compartir información
29/11/2023
¿cómo nos encontramos?
1_ resumen sesión anterior
cómo pasar el df_HR.info() a excel? ==> no se puede (a ver, se puede pero no separa en columnas, habría q insertar todos los datos de manera manual / ayudarnos de IA) Revisado fichero la tabla info_df_HR_RAW_DATA.xlsx Lo hemos codificado por colores sobre las acciones a tomar: Amarillo: preguntar qué hacer/qué nos recomiendan/hablar con la empresa Verde: ya ok (tenemos claro lo que hay que hacer)
2_ avances/retos/stoppers
Dudas sobre la interpretación de algunos datos --> acordamos hablar con el cliente
3_ plan para hoy
hablar con la empresa Actualizar fichero en función de la información que nos de la empresa (filas en amarillo) info_df_HR_RAW_DATA.xlsx avanzamos código de limpieza y normalización con el .ipynb
30/11/2023
¿cómo nos encontramos?
1_ resumen sesión anterior
documentado actualizado con info del cliente info_df_HR_RAW_DATA.xlsx
Hablamos con el representante del cliente (César):
última acción: columna Employeenumber: queremos nulos, únicos y que nos elimine los duplicados quedándonos con el segundo valor (analizados los 104 duplicados hemos visto que el valor que contiene más información es el segundo que aparece).
2_ avances/retos/stoppers
nulos/únicos/duplicados en el df columna Employeenumber duda: ¿cómo se enlaza un Markdown al Readme?
3_plan para hoy
seguir avanzando en la limpieza y normalización de la tabla
04/12/2023
¿cómo nos encontramos?
1_ resumen sesión anterior Limpieza de columnas numéricas
2_ avances/retos/stoppers Falta en numéricas Worklifebalance
3_plan para hoy Worklifebalance como Float --> pend gestion nulos tbd Employee nr --> NaN sustituidos, INT
05/12/2023
¿cómo nos encontramos?
1_ resumen sesión anterior Hecha la estión de los nulos de la columna Department Terminamos con la limpieza de columnas categóricas
2_ avances/retos/stoppers
3_plan para hoy Limpiar numéricas
13/12/2023
¿cómo nos encontramos?
1_ resumen sesión anterior Solucionados los problemas de limpieza que han surgido a la hora de subir las tablas a MySQL
2_ avances/retos/stoppers Resolver problemas de inserción tabla3 - ante la imposibilidad de subir a SQL de forma tradicional (consultado con César, muchos intentos), dedicimos realizar subida manual. Para ello abrimos el .csv en un excel y concatenamos datos y caracteres de acuerdo a la lógica del programa (tuplas de datos).
3_plan para hoy Resolver problemas de inserción tabla3 Finalizada subida de datos a SQL Reorganizar los ficheros en GitHub
23/11/2023 0_ Compartimos honestamente cómo estamos
1_ repasamos lo que se acordó en la sesión anterior/lo que hicimos (breve)
2_ Compartimos los avances/retos/stoppers que hemos hecho/encontrado desde la última sesión (brevemente)
3_ Qué queremos hacer hoy