In this project, we extract cinema-related data from multiple sources using an API and web scraping. The data is then transformed and loaded into a MySQL database that we designed. We implemented this using MySQL Workbench, Jupyter Notebooks, Python, and libraries like Beautiful Soup, Selenium, MySQL Connector, Pandas, and NumPy.
1
stars
0
forks
source link
Extracción de Detalles de Actores con Selenium (Fase 3) #5
Fase 3: Extracción de Detalles de Actores con Selenium
Extraer información detallada de los 10 primeros actores de cada una de las películas o cortos extraídos en la fase 1 utilizando Selenium (desde la página de IMBD). La información que se deberá extraer es:
Nombre.
Año nacimiento.
¿Por qué es conocido?
¿Qué hace?
Premios.
La información de la API deberá ser almacenada en una lista de tuplas. Cada tupla corresponderá a una película. Siguiendo el siguiente ejemplo:
[x] Extracción detallada de la información de 3 actores para reducir el tiempo de proceso de cada película. Extrae la información de todas las películas y cortos recuperados mediante la API de MoviesDataset.
Fase 3: Extracción de Detalles de Actores con Selenium
Extraer información detallada de los 10 primeros actores de cada una de las películas o cortos extraídos en la fase 1 utilizando Selenium (desde la página de IMBD). La información que se deberá extraer es:
La información de la API deberá ser almacenada en una lista de tuplas. Cada tupla corresponderá a una película. Siguiendo el siguiente ejemplo:
[("Adam Sadler", 1966, ["El aguador", "Little Nicky", "Un papá genial", "El chico ideal" ], ["Reparto", "Producción", "Guion"] , ["American Comedy Awards, USA", "Annie Awards"], ),
...]
@BeaDataArtist @carla-caracola