Robertopucp / 1ECO35_2023_1

6 stars 10 forks source link

Workgroup5 #127

Open Robertopucp opened 1 year ago

Robertopucp commented 1 year ago

Script R y Python (Jupiter notebook)

Plot

  1. Replicar el siguiente gráfico (producción de hoja de coca en hectáreas) lo más parecido posible en términos de color de series por paises, diseño de la series, diseño de la leyenda, nota de pie de página y titulo de los ejes pues la disponibilidad de datos es diferente 2009-2020.

replicacion_img

  1. Relizar un gráfico similar con los datos de erradicación de hectareas de hoja de Coca.
  2. Realizar un gráfico con la producción y erradicación de hoja de coca en el Perú.

Exportar los gráficos en formato .png y guardarlos en la siguiente carpeta del repositorio: output\plots

Regex

  1. La base de datos metropolitano.xlsx posse información de latitud y longitud de las estaciones del metropiltano y dos lineas de alimentadores. Usar regex para cambiar el formato de las coordenadas a uno de coordenadas geográficos (i.e -11.25, -69.56). Guiese de la aplicación a las coordenadas del Capac Ñan usada en el script de python.

  2. En la carpeta estudiantes, ustedes encontrarán una base de datos llamada base_estudiantes.xlsx (Una base de datos muy sucia). La base de datos contiene información de estudiantes de la educación básica regular. Las variables son las siguientes: nombre, edad, fecha de nacimiento, tipo de administración de la institución educativa, género, correro electrónico, dni del apoderado, madre o padre, y una variable con observaciones.

Realizar la siguiente limpieza de datos asi como creación de las variables usando Expresiones Regulares

_ Importante: Recordar que escribir código es como redactar. En ese sentido, se calificará el orden, añadir comentarios y subtítulos. Recuerde verificar todas las líneas de código y que no haya problemas. Yo espero no encontrar errores al correr sus scripts. El script de su grupo debe tener el siguiente nombre. Un ejemplo, Grupo_2_py, Grupo_2r* para nombrar los scripts de python y R respectivamente

Las bases de datos están en la carpeta data

Guardar sus scripts en la siguiente carpeta Labs\tarea5

Deadline: domingo 4 de junio 11:59 pm