carla-caracola / cinem_extract_phyton_SQL

In this project, we extract cinema-related data from multiple sources using an API and web scraping. The data is then transformed and loaded into a MySQL database that we designed. We implemented this using MySQL Workbench, Jupyter Notebooks, Python, and libraries like Beautiful Soup, Selenium, MySQL Connector, Pandas, and NumPy.
1 stars 0 forks source link

Fase 2.A - Extracción de info películas desde IMDB #4

Closed carla-caracola closed 2 months ago

carla-caracola commented 2 months ago

Extraer información de las películas desde el sitio web de IMDB.

Criterios de aceptación:

[(7.7, 77, "Richard Donner", ["Chris ColumbusSteven", "Spielberg"], "Los Goonies son un grupo de amigos que viven en Goon Docks, Astoria, pero sus casas han sido compradas y van a ser demolidas. Sin embargo, vivirán su última aventura en busca de un tesoro que pueda salvar el barrio.", "Aventura", "1h 54min", "Los Gonnies"), ...]

Info a extraer:

carla-caracola commented 2 months ago

@BeaDataArtist @CecileSC esta parte de la Fase 2 ya está lista para revisión. El código está puesto para iterar en una lista de testing que tiene solo 2 películas para que sea rápido.

No conseguí extraer el argumento de la peli desde esta página, pero si lo pude hacer desde la otra página.

carla-caracola commented 2 months ago

Esto ya está terminado para este Sprint. El punto 3, pasar a funciones no voy a llegar a cubrirlo ya que tuve mas complicaciones de las esperadas para hacer funcionar el código. He creado un ticket aparte para abordar eso: https://github.com/carla-caracola/cinem_extract_phyton_SQL/issues/13