unb-mds / 2023-2-Squad05-TesouroMineiro

https://unb-mds.github.io/2023-2-Squad05-TesouroMineiro/
https://tesouromineiro.vercel.app/
MIT License
4 stars 2 forks source link

Web Scrapping do DOU(duo) #27

Closed EliasOliver21 closed 11 months ago

EliasOliver21 commented 11 months ago

Descrição

Esta issue tem como objetivo realizar o web scraping de um site específico para baixar documentos oficiais da União. O site em questão contém informações relevantes que precisam ser extraídas de forma automatizada para posterior análise ou arquivamento.

Objetivo

O objetivo principal desta tarefa é desenvolver um spider usando a biblioteca Scrapy para acessar o site, coletar os documentos oficiais da União e salvar as informações relevantes em um formato desejado. Isso permitirá a obtenção eficiente desses documentos sem a necessidade de acesso manual.

Pontos Importantes

Critérios de Aceitação