okfn-brasil / querido-diario

📰 Diários oficiais brasileiros acessíveis a todos | 📰 Brazilian government gazettes, accessible to everyone.
https://queridodiario.ok.org.br/
MIT License
1.08k stars 393 forks source link

squash new spider pb_santa_rita #1070

Open almeidadm opened 8 months ago

almeidadm commented 8 months ago

AO ABRIR um Pull Request de um novo raspador (spider), marque com um X cada um dos items do checklist abaixo. NÃO ABRA um novo Pull Request antes de completar todos os items abaixo.

Checklist - Novo spider

Descrição

A principal dificuldade em construir essa spider se deu na coleta dos números de edição. O número de edição quando disponibilizado é econtrado apenas na URL de forma não padronizada. Foi necessário criar um padrão de regex que atendesse pelo menos 11 casos de formatação de URL, os quais estão listados aqui: https://regexr.com/7qsaa.

Resolve #510