Martes 3 de enero
Después del sprint decidimos escribir un read en el que resumimos lo que hemos avanzado durante el día y lo que vamos a hacer el siguiente.
Hoy llegamos a la conclusión de que en vez de contestar a cinco preguntar independientes, de la manera que las tenemos planteadas igual nos quedamos en la primera ahondando en ella y extrayendo las cinco de la misma.
PRIMERA PREGUNTA: SALARIO MEDIO EN FUNCION DE EDAD, GENERO, AÑOS EXP, PAIS, SECTOR DE TRABAJO.
Los datos que nos hacen falta para contestar a esta primera pregunta son :
Salario : hemos visto que e 40% de la gente entrevistada no contesta a la pregunta. De esto sacamos dos visas de estudio: De las que tenemos el salario y de las que no (país, razón, genero…) Este dato es el principal que nos va a guiar en un primer momento ya que la primera pregunta que nos planteamos es el salario medio.
Edad
Genero
Años de experiencia
Pais/ continente
sector de trabajo- tiene un gran numero de nulos también.
TRABAJO DIA 4: Terminar de trabajar bien los datos para poder contestar a las preguntas. Hacer gráficas para ver los datos de manera visual. Limpiar las carpetas y organización de csv´s.
Miércoles 4 de enero
Lo primero limpiamos las carpetas y organizamos los csv´s. Renombramos los archivos para localizarlos mejor.
Revisamos la tabla con las columnas con las que vamos a trabajar. Abrimos un archivo nuevo (03_pregunta_trabajo).
Estamos estancadas en como hacer subplots con los rangos de salarios en funcion de los continentes. Hemos hecho un boxplot con los rangos de salarios y los años de experiencia.
TRABAJO DIA 5: Más gráficas y discutimos sobre lo que hacemos con los outliers.