Closed victorfernandesraton closed 1 month ago
Criei esta PR com base no que foi feito em https://github.com/okfn-brasil/querido-diario/pull/1186 Porém esta está dezatualizada,e devido a mudança nos raspadores eu acredito que revisar do começo faça mais sentido
Valeu, @victorfernandesraton! Coloquei na fila de revisão.
Segue em anexos extração completa com csv e logs output-all.log output-all.csv
Testes de busca entre 04-06-2024 e 02-07-2024 output-06-07.log output-06-07.csv
@victorfernandesraton vou fazer squash pra ficar somente um commit do @gabrielqr e um seu, beleza? Como é apenas um raspador, 12 commits onde a maioria é de correções ficaria excessivo. Normalmente apenas 1 já seria suficiente
Layout do site publicador de diários oficiais
Marque apenas um dos itens a seguir:
Código da(s) spider(s)
custom_settings
em meu raspador.Testes
.log
deste teste está anexado na PR..log
e.csv
deste teste estão anexados na PR..log
e.csv
deste teste estão anexados na PR.Verificações
.csv
gerados pela minha coleta conforme a documentação não encontrando problemas..log
gerados pela minha coleta conforme a documentação não encontrando problemas.Descrição
Reimplementação do raspador do município de Maragogi AL , anteriormente citado nesta issue https://github.com/okfn-brasil/querido-diario/issues/1176 e feito parcialmente nesta PR https://github.com/okfn-brasil/querido-diario/pull/1186, porém o mesmo ficou muito tempo esperando retorno do desenvolvedor, visto que houve mudanças drásticas no site dos diários oficiais em questão, decidi abrir esta nova PR para facilitar o fluxo de revisão
Logs e outputs de uma extração completa: output-all.log output-all.csv
Logs e outputs de uma extração com data aleatória (2024-05-10 até 2024-08-23): output-date.csv output-date.log