Open renata-olivmachado opened 2 months ago
Arquivo da classe ScraperLinkedin no repositório
Após confirmação de login é possivel rodar um loop para acessar cada página de extração:
extraction_urls = [
f"https://www.linkedin.com/company/{self.company_code}/admin/analytics/updates/",
f"https://www.linkedin.com/company/{self.company_code}/admin/analytics/visitors/",
f"https://www.linkedin.com/company/{self.company_code}/admin/analytics/followers/",
f"https://www.linkedin.com/company/{self.company_code}/admin/analytics/competitors/",
]
for url in extraction_urls:
self.driver.get(url)
Esse trecho de código está presente na função ScraperLinkedin.extract_data
Tarefa da Story: https://github.com/SouJunior/dashboard-midias/issues/16
Desenvolver webscraping Python, podendo usar selenium ou outra lib. O webscraping deve logar no LinkedIn, acessar a página do SJ e extrair os dados para o AWS S3.