okfn-brasil / querido-diario

📰 Diários oficiais brasileiros acessíveis a todos | 📰 Brazilian government gazettes, accessible to everyone.
https://queridodiario.ok.org.br/
MIT License
1.11k stars 411 forks source link

[Novo spider base]: Nome não identificado #1246

Closed trevineju closed 2 months ago

trevineju commented 3 months ago

URL

não identificada

Municípios replicados

1. https://varresai.rj.gov.br/site/diarios_oficiais
2. https://www.sjb.rj.gov.br/site/diarios_oficiais

Formato da publicação

Os diários oficiais são publicados em PDF (texto)

Detalhes do site de publicação

Possui paginação

Observações

  1. No geral, na página tem algum rastro de "desenvolvido por tal" ou alguns elementos no código-fonte que indicam que empresa ou órgão público desenvolveu a solução. Usamos essa informação para nomear a classe base. Em uma verificação inicial, não encontrei quem foi. Se quem for fazer a tarefa de desenvolvimento também não encontrar, poderá nomear a classe base como preferir, mas com bom senso.
  2. Visualmente pode não parecer muito, mas olhando rapidamente os seletores do site, a hierarquia de informação e o nome dos elementos parecem iguais para coletar as edições. Vamos adotar inicialmente que é o mesmo padrão.

Não existe uma issue aberta sobre isso

slfabio commented 3 months ago

Vou implementar a base para esses municípios. Utilizarei como nome da base portalgov, a empresa que desenvolve a solução, conforme links abaixo: https://www.varresai.rj.gov.br/arquivos/diario_oficial/211_02_211_diario_oficial_de_varre-sai_edicao_211-02.pdf (p. 2 - DISPENSA DE LICITAÇÃO Nº. 020/2021) https://sjb.rj.gov.br/arquivos/diario_oficial/226_23_diario_oficial_eletronico_de_14_de_dezembro_de_2023-edicao_226.pdf (p. 3 - CONVITE Nº 022/2023)

Trata-se da mesma empresa que fornece a solução de diário ofcial (https://cidennf.com.br/site/diarios_oficiais) para o Consórcio Intermunicipal do norte fluminense (CIDENNF). https://cidennf.com.br/arquivos/diario_oficial/344_03_edicao_344.pdf