Adalab / project2-da-promo-c-modulo-2-team4

1 stars 4 forks source link

Presentación #29

Open XimenaPTM opened 1 year ago

XimenaPTM commented 1 year ago

Pregunta 1: archivo 4.1

Elección de las gráficas

Introducción:

Gráficas1.1 , 1.2 Info general por género, 1.3 (ocupación), 1.3.1 (ocupación adicional), 1.4 (Años de expreincia y género.

Género introducción y la brecha de género. Introducción d estas personas en el sector tecnológico. Tech, como otros sectores está copado por señoros. Falta de referentes para las mujeres. Trabajar en incorporar referentes, resaltar la presencia de otros géneros. No existe igualdad. Hay roles y estereotipos de género marcados.

Ideas claves:

-Sector joven donde el rango de edad con más presencia se encuentra entre los 22-29 años se. Puede haber más del 50% de los datos.

-Países y género, se han seleccionado 10 países conforme requerimientos del cliente.

Acotación a analista de datos

Es el perfil que apunta el cliente con su servicio.

Pregunta 3: Preguntas técnicas

iNSERTAR "graficas/07-3-Lenguajes más utilizados.png"

El Bootcamp ahora mismo esta bien enfocado: se centra en dos lenguajes principalmente, Python y SQL, que son los dos lenguajes que más se utilizan, con bastante diferencia, en el entorno laboral de los Data Analyst. El 17% de nuestra muestra utiliza uno de estos dos lenguajes. El siguiente sería R, aunque solo lo utiliza un 3% . Teniendo en cuenta que R es un lenguaje más lento en ejecución y más complejo en su desarrollo, creemos que efectivamente centrarse en Python y SQL es la mejor opción. Aunque R está más centrado en el análisis estadístico complejo, Adalab no cuenta con un perfil de alumnas que provengan de entornos porfesionales matemáticos.

INSERTAR

graficas/08-3-Lenguajes recomendados por DA.png De hecho, si preguntos a los Analistas de Datos que lenguaje recomiendan, Python sigue en cabeza.

INSERTAR CUARTO GRÁFICO 4.3. pregunta3_i Sobre los productos de Big Data más populares entre los analistas, tenemos MySQL en cabeza , pero ojo, seguido muy de cerca por Microsoft SQL Server. Funcionan con una sintaxis diferente, por lo que no estaría de más incluir una snociones básicas del segundo por si las alumnas tienen que enfrentarse a él en el entrono laboral. Aunque también es cierte, que SQL Server es solía ejecutarse exclusivamente en Windows y teniendo en cuenta la variedad de sistemas de las adalabers, recomendamos priorizar MySQL, como se viene haciendo.

ambientes de desarrollo

insertar graficas/09-3-Ambientes más utilizados.png

De nuevo, parece que el bootcamp está bien enfocado: vemos como los ambientes de desarrollo integrados más utilizados por los DA son Jupyter Notebooks y Visual Studio. En Adalab se trabaja con Jupyter dentro de Visual Studio, por lo que las adalaber manejan ambos ambientes con soltura tras finalizar el bootcamp.

Herramientas de visualización

insertar graficas/14-3-Herramientas de visualización.png

Por último, repasando las herramientas de visualización de nuestros datos: también Adalab se centra en las más punteras. El programa actual incluye Matplotlib y Seaborn, y el 60% de los analistas de datos utilizan estas herramientas. Además, durante el programa se mencionan el resto de librerías (aunque no se profundiza en ellas, si no que se aañden como un bonus durante clases de repaso) Por lo que las alumnas pueden investigar por su cuenta. Eso sí, consideramos que Plotly es interesante: es una herramienta colaborativa e interactiva que contiene una librería de gráficos más amplia que matplotlib. Entendemos que matplotlib es más antigua que esta, y que su uso esté más asentado (lo que lo hace la favorita, pues mas personas compraten conocimientos para utilizarla), pero también pensamos que siendo plotly la tercera en esta lista , que tiene más funcionalidades y que está creciendo, creemos que si Adalb quiere estar en la vanguardia, debería también considerar Plotly dentro de su programa.

XimenaPTM commented 1 year ago

Tareas:

-[ ] Horario para quedar este finde. Viernes 8pm, Sábado mañana 10:00 , Domingo entero 10:00

-[ ] Conclusiones. Introducción (Natalia)

XimenaPTM commented 1 year ago

Guión:

Saludo

Buenos días a todas esta mañana realizaremos la exposición del proyecto Data DAtos, solicitado por nuestro cliente Adalab.

Presentación del equipo

Nosotras somos Supernovas, un equipo de trabajo orientado a brindar soluciones éticas y eficientes a nuestros clientes.

Adalab

Nuestro cliente Adalab, nos ha solicitado información relevante para mejorar su oferta educativa respecto al Bootcamp de Data Analytics, para ello hemos investigado sobre el perfil actual de los analistas de datos, el mercado laboral, y los conocimientos y herramientas más utilizados.

Este trabajo incorpora la perspectiva de género para dar respuesta al nicho de mercado del cliente, alineado con la misión de Supernovas, enfocar los datos para lograr la incorporación de las mujeres y otros géneros minoritarios en el mundo TECH.

A su vez, hemos hecho referencia a los datos recopilados en España, pese a ser una muestra pequeña, para tener una visión referencial sobre la situación en el país donde se asienta la sede de Adalab.

Comprobar si el perfil al que esta dirigido su bootcamp es correcto

Objetivos:

Para ellos nos planteamos tres preguntas claves.

Introducción:

El estudio ha utilizado los datos recopilado en la encuesta aplicada por Kaggle en 2021 sobre Machine Learning & Data Science, Esta encuesta se realiza desde 2017 en toda la industria para obtener una visión sobre el estado de la ciencia de datos y el aprendizaje automático.

En 2021 se recopilaron 25.973 respuestas, de participantes de todo el mundo, y se recoge datos sobre quién trabaja con datos, qué está ocurriendo con el aprendizaje automático en diferentes sectores y cuáles son las mejores formas para que los nuevos científicos de datos se introduzcan en este campo.

egún varias investigaciones sobre el mercado laboral y la presencia de la mujeres y otros géneros, se conoce que existe una brecha ocasionada por la tardía incorporación de la mujer en el mercado laboral. El análisis Género introducción y la brecha de género. Introducción d estas personas en el sector tecnológico. Tech, como otros sectores está copado por señoros.

Falta de referentes para las mujeres. Trabajar en incorporar referentes, resaltar la presencia de otros géneros.

No existe igualdad.

Hay roles y estereotipos de género marcados.

Ahora doy paso a mi compañera para que exponga los resultados obtenidos en el análisis de la primera pregunta que nos hemos planteado.

Pregunta 1

-Los datos obtenidos muestran, como se evidencia en las gráficas, que el sector de la ciencia de datos y el aprendizaje autonómo es un sector joven, donde el rango de edad con más presencia se encuentra entre los 22-29 años se. Cerca del 50% de los datos se encuentran en este rango de edad.

-Respecto a los países, se han seleccionado 10 países, siguiendo la documentación del análisis de Kaggle. Los participantes de la encuesta provienen principalmente de India, siendo cerca del 25%. El siguiente país con más más representación es Estados Unidos. Llama la atención el repunte de participantes de la India, respecto a 2017. En el caso de España, participaron al rededor de 500 personas en la encuesta, siendo estos mayormente hombres.

-En cuanto al nivel de educación más alto alcanzado por quienes trabajan en este sector, se evidencia que tienen mayormente formación reglada con al menos un máster o grado. En el caso de quienes trabajan como analistas de datos, cerca del 25% de personas cuentan con Otro tipo de formación no reglada.

-En cuanto los años de experiencia, podemos inferir que la mujer se ha incorporado más tarde al mercado laboral en el sector de la ciencia de datos, como observamos, hay una baja presencia de mujeres y otros géneros con más de 20 años de experiencia. Sin embargo, hay un incremento de mujeres en los últimos tres años. En el caso de los analista de datos, observamos que es una ocupación donde en los últimos tres años hay mayor presencia de mujeres y otros géneros.

Pregunta 2 Mercado laboral. ¿Qué industria paga mejor?

-Sobre el tamaño la mayoría de analistas trabja en empresas de menos de 50 trabajadores o en grandes compañías con más de 10,000 trabajadores. La tendencia de mayor presencia de hombres respecto a otros géneros es transversal a todas las empresas.

Pregunta 3: ¿Qué herramientas utilizan los Data Analystç? ¿Debe Adalab incluir o retirar alguna de su programa de enseñanza?

Si pasamos a ver que requerimientos técnicos necesita un Analista de Datos para comporbar si el programa de Adalab es coherente con aquello que se utiliza en el mercado:

Observamos que el Bootcamp ahora mismo esta bien enfocado en cuánto a lenguajes: se centra en dos principalmente, Python y SQL, que son los dos que más se utilizan, con bastante diferencia, en el entorno laboral de los Data Analyst. El 17% de nuestra muestra utiliza uno de estos dos lenguajes. El siguiente sería R, aunque solo lo utiliza un 3% . Teniendo en cuenta que R es un lenguaje más lento en ejecución y más complejo en su desarrollo, creemos que efectivamente centrarse en Python y SQL es la mejor opción. Aunque R está más centrado en el análisis estadístico complejo, Adalab no cuenta con un perfil de alumnas que provengan de entornos porfesionales matemáticos.

Sobre los productos de Big Data más populares entre los analistas, tenemos MySQL en cabeza , pero ojo, seguido muy de cerca por Microsoft SQL Server. Funcionan con una sintaxis diferente, por lo que no estaría de más incluir unas nociones básicas del segundo por si las alumnas tienen que enfrentarse a él en el entrono laboral. Aunque también es ciert0 que SQL Server solía ejecutarse exclusivamente en Windows: teniendo en cuenta la variedad de sistemas de las adalabers, recomendamos priorizar MySQL, como se viene haciendo.

Si pasamos a los ambientes de desarrollo, de nuevo parece que el bootcamp va por buen camino: vemos como los ambientes de desarrollo integrados más utilizados por los DA son Jupyter Notebooks y Visual Studio. En Adalab se trabaja con Jupyter dentro de Visual Studio, por lo que las adalaber manejan ambos ambientes con soltura tras finalizar el bootcamp.

Por último, repasando las herramientas de visualización de nuestros datos: también Adalab se centra en las más punteras. El programa actual incluye Matplotlib y Seaborn, y el 60% de los analistas de datos utilizan estas. Además, durante el programa se mencionan el resto de librerías, por lo que las alumnas pueden investigar por su cuenta. Eso sí, consideramos que Plotly es interesante: es una herramienta colaborativa e interactiva que contiene una librería de gráficos más amplia que matplotlib. Entendemos que matplotlib es más antigua que esta, y que su uso esté más asentado (lo que lo hace la favorita, pues mas personas compraten conocimientos para utilizarla), pero también opinamos que siendo plotly la tercera en esta lista , que incluye más funcionalidades y que está creciendo, creemos que si Adalab quiere estar en la vanguardia, debería también considerarla Plotly dentro de su programa.

Propuesta:

Buena dirección Vemos que Adalab va en el camino correcto, que esta a la ultima en las tecnologías, y en tiene un buen estudio del perfil al que enfocar su producto.

Recomendamos Hacer este estudio una vez al año, ya que la globalización y los cambios en el mundo de la tecnología se producen muy rápidamente y así poder comprobar si sigue en esta buena dirección o si tiene algo que incorporar o cambiar de cara a próximos bootcamps.

Esperamos Que contéis con nosotras ya que nos hemos familiarizado con el ambiente y la esencia de Adalab y nos encantaría poder aportar nuevas conclusiones en el futuro.