¿Eres un apasionado del cine? ¿Te gusta saber hasta el mínimo detalle de tus películas favoritas? ¿Te gustaría que las sugerencias de tu plataforma de streaming te haga sugerencias personalizadas acorde a tus gustos? Enhorabuena, estás en el sitio correcto, ¡bienvenido a Movie World!
Este proyecto ha sido desarrollado con el fin de aplicar las técnicas aprendidas para lograr crear una base de datos sólida de películas y cortometrajes populares y mejor valorados desde el año 2000 hasta 2023 de tres géneros: Drama, Acción y Comedia.
Como cualquier cosa bien hecha, esto se ha logrado gracias a un trabajo en equipo y colaboración. ¡Hola! Somos Marina, Alejandra, Laura, Nerea y Karine, estudiantes del curso de Data Analytics en Adalab. Tenemos el gusto de presentaros nuestro maravilloso proyecto, el cual nos ha supuesto un gran reto a nivel personal pero nos ha hecho mejorar y aprender en el proceso de desarrollo. ¡Esperamos que os guste y os fascine como a nosotras el haberlo hecho!
Si quieres echar un vistazo a nuestra base de datos y comprobar toda la información extraída debes:
- Descarga o clona el repositorio a tu máquina local.
- Dentro del repositorio encontrarás:
- Extracciones: todos los archivos csv con la información recopilada.
- BBDD: SQL, consultas a la BBDD y códigos utilizados para insertar datos en BBDD.
- Códigos_extracciones: códigos utilizados para extraer datos de API y a través de Web Scraping.
- Asegúrate de tener instaladas todas las dependencias necesarias. Dentro de nuestros archivos encontrarás todos los detalles al respecto.
- Sigue las instrucciones de uso para obtener información detallada sobre cómo ejecutar y utilizar el proyecto.
Según tus preferencias en nuestro proyecto te damos la opción de:
- Extraer tú mismo la información en caso de que quieras un género cinematográfico diferente u otro rango de años:
- En la carpeta 'Codigos_extracciones' debes acceder al archivo 'Código-extraccion_movieData.ipynb' el cual te dará la información necesaria para poder hacerlo tú mismo, podrás extraer la información a través de la API: "https://rapidapi.com/SAdrian/api/moviesdatabase/" y usando nuestro código.
- Recuerda que para poder ejecutar este código debes tener instaladas todas las dependencias necesarias. En caso de que no las tengas te explicamos cómo en el archivo anterior.
- Revisar toda la información extraída:
- En la carpeta 'Extracciones' encontrarás cuatro subcarpertas donde hemos clasificado la información extraída en formato ipynb con detalles sobre las películas, valoraciones de los usuarios (IMDB y Rotten Tomatoes) e información sobre los actores.
- En la carpeta 'BBDD' encontrarás todo lo necesario para exportar nuestra base de datos 'ProyectoCinemExtract'y ver toda la información que hemos insertado a la misma. Además de esto podrás hacerle consultas para recopilar la información que necesites.
- Podrás visualizar todos los archivos con un editor de texto simple pero te recomendamos instalarte MySQL Workbench para mejorar tu experiencia con nuestra BBDD y en caso de interés, esto te permitirá realizar consultas.
- Recopilar información detallada sobre películas y cortometrajes (datos extraídos de la API de MoviesDataset), puntuaciones de IMDB y Rotten Tomatoes, información sobre los actores y premios Oscar con Web scraping.
- Estructurar una base de datos en SQL para almacenar toda la información recopilada de manera organizada.
- Desarrollar consultas SQL para recuperar información específica de la base de datos.
- Identificar tendencias y preferencias de los usuarios en la industria cinematográfica.
- Mejorar la eficiencia en la extracción de datos.
- Ampliar la cobertura de fuentes de datos para obtener información más completa.
- Optimizar consultas SQL para mejorar el rendimiento de la base de datos.
- Implementar funcionalidades adicionales para análisis avanzados de datos.
Como equipo consideramos que todas las ideas son bienvenidas y nos hacen mejorar como profesionales y equipo. Por eso consideramos importante que si tienes alguna idea o sugerencia que pueda aportar algo a nuestro proyecto, estaremos encantadas de oír cualquier propuesta de mejora. ¡Te animo a echarle un vistazo a nuestro proyecto! ¡Si hay algo que podamos hacer para que sea aún mejor, no dudes en contactarnos!
Si deseas conocer más sobre el resto del equipo y explorar otros proyectos realizados, os dejamos los perfiles de GitHub:
- https://github.com/marinaescobar
- https://github.com/LauraGenesis
- https://github.com/ADSBorges
- https://github.com/Dondiz