guilhermecugler / Scraper-Casa-dos-Dados

Scraper feito em python para puxar dados do site "casa dos dados" de acordo com os filtros desejados.
MIT License
26 stars 20 forks source link

Scraper Casa dos Dados

Hits

GitHub repo size GitHub language count GitHub forks Bitbucket open issues Bitbucket open pull requests

⚠️⚠️⚠️ No momento devido a atualizações do site Casa dos Dados o scraper está sendo atualizado e encontra-se infuncional.⚠️⚠️⚠️

⚠️ Devido a mudanças no site Casa dos Dados, que agora usa uma proteção da Cloudflare para bloquear scrapers e crawlers, tivemos que mudar nossa abordagem. Agora, usamos o Playwright para buscar os primeiros filtros.

Preview da interface

Scraper com interface amigável para pegar os dados do site casadosdados utlizando funções assincronas retornando 1000 resultados em aproximadamente 1 minuto.

Ajustes e melhorias

O projeto ainda está em desenvolvimento e as próximas atualizações serão feitas:

💻 Pré-requisitos

Antes de começar, verifique se você atendeu aos seguintes requisitos:

🚀 Instalando

Para instalar, siga estas etapas:

🖥️ Executando do Código Fonte

Windows:

1. Clone este repositório:
git clone https://github.com/guilhermecugler/Scraper-Casa-dos-Dados.git

2. Navegue até a pasta clonada

3. Instale as dependências:
pip install -r .\requirements.txt

☕ Usando

Para usar, siga estas etapas:

1. Vá até a pasta do projeto onde contém o casadosdados.py
2. Execute com: python .\casadosdados.py

📫 Contribuindo

Para contribuir, siga estas etapas:

  1. Bifurque este repositório.
  2. Crie um branch: git checkout -b <nome_branch>.
  3. Faça suas alterações e confirme-as: git commit -m '<mensagem_commit>'
  4. Envie para o branch original: git push origin <ScraperCasaDosDados> / <local>
  5. Crie a solicitação de pull.

Como alternativa, consulte a documentação do GitHub em como criar uma solicitação pull.

🤝 Colaboradores

O projeto está a ser mantido por mim e pelo timotheeMM.

Foto do Iuri Silva no GitHub
Guilherme Cugler
Foto do timotheeMM no GitHub
timotheeMM

😄 Seja um dos contribuidores

Se estiver contribuindo com o projeto, adicione seu nome de usuário do GitHub ao arquivo CONTRIBUTORS.md.

📝 Licença

Esse projeto está sob licença GNU General Public License v3.0. Veja LICENÇA para mais detalhes.