MPMG-DCC-UFMG / C01

Coleta de Dados Públicos
GNU General Public License v3.0
18 stars 9 forks source link

Coleta de dados de Licitações de Pará de Minas #628

Open asafeclemente opened 3 years ago

asafeclemente commented 3 years ago

Comportamento Esperado

Requisição da extração de informações e documentos a respeito das Licitações da cidade de Pará de Minas. A extração tem o objetivo de obter dados como a Data de abertura e fechamento, a situação e o objeto de cada uma das licitações.

Comportamento Atual

Não se aplica.

Localização

Não possui nenhuma coleta atualmente. Para fins de organização separar dados a nível de município (e.g. /datalake/ufmg/crawler/webcrawlerc01/Para de Minas).

Detalhes da fonte

Os dados a serem extraídos podem ser encontrados no seguinte link: •https://transparencia.parademinas.mg.gov.br/licitacoes

São de nosso interesse o conteúdo da página acima e todas as seguintes além do conteúdo de cada licitação nela contida.

Para isso essa coleta não é necessário fazer nenhuma filtragem, mas sim acessar em cada uma das páginas todos os seus itens e coletar os documentos em anexo.
Os detalhes estão expostos nas screenshots abaixo.

Detalhes da trilha

Os dados aqui solicitados são de interesse da trilha F01, sob coordenação de Rodrygo Santos (rodrygo@gmail.com).

Screenshots e Links

Os screenshots a seguir mostram como obter as informações de interesse.

Por padrão os 698 dados foram apresentados de 10 em 10, por página Screenshot from 2021-07-20 10-17-46

Para coletar cada um das licitações é necessário clicar em cada um delas: Screenshot from 2021-07-20 10-19-10

Coletar o conteúdo da licitação em específico Screenshot from 2021-07-20 10-20-17

Cada um dos editais e resultados se disponíveis: Screenshot from 2021-07-20 10-21-31 Screenshot from 2021-07-20 10-21-39

Coletadas todas dessa página fazer o mesmo para as demais páginas de licitações: Screenshot from 2021-07-20 10-22-38

aluiza22 commented 2 years ago

Olá, @asafeclemente ! Os arquivos dos conteúdos das páginas solicitadas já se encontram em /datalake/ufmg/webcrawlerc01/Para_de_Minas/licitacoes_f01/raw_pages. O download dos arquivos está bloqueado pela issue #843 , quando este for resolvido, será possivel rodar novamente o coletor de id 181 no servidor para baixar também os arquivos. Caso haja algum problema com a coleta, favor informar por meio desta issue.