okfn-brasil / querido-diario

📰 Diários oficiais brasileiros acessíveis a todos | 📰 Brazilian government gazettes, accessible to everyone.
https://queridodiario.ok.org.br/
MIT License
1.08k stars 393 forks source link

[Novo spider base]: Nome não identificado #1243

Open trevineju opened 1 month ago

trevineju commented 1 month ago

URL

não identificada

Municípios replicados

1. https://carapebus.rj.gov.br/m/Diario_Oficial
2. https://www.conceicaodemacabu.rj.gov.br/m/Diario_Oficial

Formato da publicação

Os diários oficiais são publicados em PDF (texto)

Detalhes do site de publicação

Possui filtro por data

Observações

  1. No geral, na página tem algum rastro de "desenvolvido por tal" ou alguns elementos no código-fonte que indicam que empresa ou órgão público desenvolveu a solução. Usamos essa informação para nomear a classe base. Em uma verificação inicial, não encontrei quem foi. Se quem for fazer a tarefa de desenvolvimento também não encontrar, poderá nomear a classe base como preferir, mas com bom senso.

  2. Apesar do filtro por data, como a lista de diários é continua (ou seja, não tem paginação, todos os diários estão já na página inicial) não parece ser relevante construir o raspador usando a navegação do filtro.

Não existe uma issue aberta sobre isso

victorfernandesraton commented 3 days ago

@trevineju eu encontrei essa informação aqui a respeito do primeiro link https://carapebus.rj.gov.br/pagina/15657/Sobre%20a%20ZEN