Open LucasAlvws opened 3 weeks ago
Uma coleta-teste por intervalo arbitrário al_coruripe_outubro2024.csv log_al_coruripe_outubro2024.log
Uma coleta-teste da última edição log_al_coruripe_last_edition.log al_coruripe_last_edition.csv
Rodei a consulta completa e houve alguns erros, mas não consegui entender exatamente o que são. Precisaria de uma ajuda para saber se posso resolve-los. al_coruripe.csv log_al_coruripe.log
Boa, Lucas
Rodei a consulta completa e houve alguns erros, mas não consegui entender exatamente o que são. Precisaria de uma ajuda para saber se posso resolve-los.
Conferiu essa seção da documentação? https://docs.queridodiario.ok.org.br/pt-br/latest/contribuindo/raspadores.html#explorando-o-log
Olá, após verificar a documetação e fiz mais alguns testes e modificações, mas não consigo fazer o download dessas duas edições
2024-11-03 22:26:48 [scrapy.downloadermiddlewares.retry] ERROR: Gave up retrying <GET https://diario.coruripe.al.gov.br/diarios/732/download> (failed 3 times): 500 Internal Server Error
2024-11-03 22:26:48 [scrapy.core.engine] DEBUG: Crawled (500) <GET https://diario.coruripe.al.gov.br/diarios/732/download> (referer: None)
2024-11-03 22:26:48 [scrapy.pipelines.files] WARNING: File (code: 500): Error downloading file from <GET https://diario.coruripe.al.gov.br/diarios/732/download> referred in
2024-11-03 22:35:46 [scrapy.downloadermiddlewares.retry] ERROR: Gave up retrying <GET https://diario.coruripe.al.gov.br/diarios/128/download> (failed 3 times): 500 Internal Server Error
2024-11-03 22:35:46 [scrapy.core.engine] DEBUG: Crawled (500) <GET https://diario.coruripe.al.gov.br/diarios/128/download> (referer: None)
2024-11-03 22:35:46 [scrapy.pipelines.files] WARNING: File (code: 500): Error downloading file from <GET https://diario.coruripe.al.gov.br/diarios/128/download> referred in
mesmo tentando fazer o download na mão eu não estou conseguindo. Vocês conseguiriam testar os links para mim?
edição 124
edição 727
AO ABRIR uma Pull Request de um novo raspador (spider), marque com um
X
cada um dos items da checklist abaixo. Caso algum item não seja marcado, JUSTIFIQUE o motivo.Layout do site publicador de diários oficiais
Marque apenas um dos itens a seguir:
Código da(s) spider(s)
custom_settings
em meu raspador.Testes
.log
deste teste está anexado na PR..log
e.csv
deste teste estão anexados na PR..log
e.csv
deste teste estão anexados na PR.Verificações
.csv
gerados pela minha coleta conforme a documentação não encontrando problemas..log
gerados pela minha coleta conforme a documentação não encontrando problemas.Descrição
Closes #1238