SouJunior / dashboard-midias

Projeto Dashboard de Mídias
1 stars 1 forks source link

[Desenvolvimento do webscraping - LinkedIn] Acessar análises da página oficial do SJ #18

Open renata-olivmachado opened 2 months ago

renata-olivmachado commented 2 months ago

Tarefa da Story: https://github.com/SouJunior/dashboard-midias/issues/16

Desenvolver webscraping Python, podendo usar selenium ou outra lib. O webscraping deve logar no LinkedIn, acessar a página do SJ e extrair os dados para o AWS S3.

Moscarde commented 2 months ago

Arquivo da classe ScraperLinkedin no repositório

Após confirmação de login é possivel rodar um loop para acessar cada página de extração:

    extraction_urls = [
            f"https://www.linkedin.com/company/{self.company_code}/admin/analytics/updates/",
            f"https://www.linkedin.com/company/{self.company_code}/admin/analytics/visitors/",
            f"https://www.linkedin.com/company/{self.company_code}/admin/analytics/followers/",
            f"https://www.linkedin.com/company/{self.company_code}/admin/analytics/competitors/",
        ]

        for url in extraction_urls:
            self.driver.get(url)

Esse trecho de código está presente na função ScraperLinkedin.extract_data