Open claromes opened 7 months ago
@claromes, obrigada por estar fazendo essa tarefa!
As coisas importantes a ser feitas são:
end_date
e modificar o nome.Pelo que vejo desta PR, ela já cumpre...
... e falta ajustar:
ba_conceicao_do_almeida.py
Também vou pedir que retire os comentários de situação. Por exemplo, pegando Itaquara:
The files between the years 2019 and 2022 are available using the Imprensa Oficial system. This city now uses the BR Transparência system, which covers other cities. The Base is not developed.
O fato do raspador estar com start_date
, end_date
e herdar a base ImprensaOficialSpider
já evidencia a informação da primeira linha, então é redundante. E, quanto a segunda, caberia mais abrir uma issue para o novo padrão que achou e listar todos os casos que já viu fazer parte do padrão.
Com isso, pode tirar todas as demais cidades dessa PR. E justando esse pouquinho, já estaria pronta pra revisão.
💯
Outra coisa... @claromes, você tinha perguntado sobre fazer duas PRs. Tô supondo que uma sendo essa PR nesse ponto que parou e a próxima cobriria as demais cidades, certo?
Você até poderia fazer isso, sim. Mas, também, pode só partir pra outra se quiser. Tô dizendo isso pq o complexo você já fez aqui que era validar a classe base, o resto seria só ajustar as classes-filhas e executar testes. Costumo sugerir esse tipo de tarefa super fácil pra pessoas novas na comunidade ou iniciantes querendo contribuir pela primeira vez.
Pro seu caso, por ser mais experiente, é mais interessante fazer outra issue, como uma que adiciona outra nova classe base. Isso também é mais interessante pra gente, visto que cada base nos possibilita adicionar dezenas ou centenas de novas cidades.
Sua escolha, claro ;)
@trevineju Obrigada pelos comentários. Fiz as alterações e só testei três cidades que mudaram. Deixei alguns comentários na descrição do PR. Pronto para revisão! \o/
Layout do site publicador de diários oficiais
Marque apenas um dos itens a seguir:
Código da(s) spider(s)
custom_settings
em meu raspador.Testes
.log
deste teste está anexado na PR..log
e.csv
deste teste estão anexados na PR.[x] Uma coleta-teste completa foi feita. Os arquivos de
.log
e.csv
deste teste estão anexados na PR.Gongogi BA:
Última edição: log_ba_gongogi_2024-05-17.txt
Intervalo (2012-05-01 a 2013-05-01): log_ba_gongogi_2012-2013.txt ba_gongogi_2012-2013.csv
Completa: log_ba_gongogi.txt ba_gongogi.csv
Itaquara BA:
Última edição: log_ba_itaquara_2019_2022-01-04.txt (Faz a raspagem, porém, tem um erro no Spidermon)
Intervalo (2020-05-01 a 2021-05-01): log_ba_itaquara_2019_2020-2021.txt ba_itaquara_2019_2020-2021.csv
Completa: log_ba_itaquara_2019.txt ba_itaquara_2019.csv
Saúde BA:
Última edição: log_ba_saude_2018_2019-04-12.txt (Faz a raspagem, porém, tem um erro no Spidermon)
Intervalo (2018-03-01 a 2019-03-01): log_ba_saude_2018-03_2019-03.txt ba_saude_2018-03_2019-03.csv
Completa: log_ba_saude_2018.txt ba_saude_2018.csv
Verificações
.csv
gerados pela minha coleta conforme a documentação não encontrando problemas..log
gerados pela minha coleta conforme a documentação não encontrando problemas.Descrição
Issue: #951
Lista:
ba_conceicao_do_almeida.py
foi deletadoba_itaquara_2019
.ba_saude_2018
.Comentários