brasiliapp / utils

Esse repositório contém as funções de web scrapper para manter a base do BrasiliApp com informações originais buscadas nas plataformas do governo federal
https://brasiliapp.com.br
27 stars 13 forks source link

Brasiliapp/Utils: Web Scraping para Dados dos Deputados Federais

Este repositório contém utilitários e funções de web scraping para coletar dados relacionados aos deputados federais na Câmara dos Deputados do Brasil. Essas ferramentas podem ser usadas para extrair as mais diversas informações que não estão disponíveis na api da câmara, ou que não estão estruturada de uma forma organizada.

As informações não disponíveis na API da câmara são estraídas do site oficial do Câmara dos Deputados (https://www.camara.leg.br/)

Se você tiver de alguma outra informação que esteja disponível lá, abra uma issue.

Funcionalidades

extract_gabinet_data.py

extract_speeches.py

Modo de Uso

Pré-requisitos

Certifique-se de ter as seguintes dependências instaladas:

Executando o Web Scraper

  1. Clone este repositório:

    
    git clone https://github.com/seu-usuario/utils.git
  2. Navegue até o diretório do repositório:

    
    cd utils
  3. Instale as dependências rodando o seguinte comando dentro do repositório:

    
    pip3 install -r requirements.txt
  4. Adicione o arquivo com as variáveis de ambiente do script. Ele deve se chamar .env, use como base o arquivo .env.example:

    cp .env.example .env
  5. Execute o script

    
    python3 extract_gabinet_data.py

Como Contribuir

Gostaríamos muito da sua ajuda para melhorar este projeto. Se você deseja contribuir, siga estas etapas:

  1. Faça um fork deste repositório.
  2. Clone o fork em sua máquina local.
  3. Crie uma nova branch: git checkout -b minha-contribuicao
  4. Faça suas alterações e commit: git commit -m "Adicionei novos recursos"
  5. Envie suas alterações para o GitHub: git push origin minha-contribuicao
  6. Abra um pull request para revisão.

Comunidade

Participe da nossa comunidade no discord para discussões, feedback e suporte: