Então o raspador que temos - am_associacao_municipios.py que usa a BaseSigpub - pode não servir mais. Ao mesmo tempo, alguns elementos de página e o layout do diário parecem seguir iguais.
Tarefa
É necessário confirmar se realmente a mudança do site demanda a mudança do raspador, testando o código atual para a nova URL e, caso o código que temos não servir mais, desenvolver o raspador para o site novo.
É necessário atualizar o raspador para seguir o padrão de projeto. Por exemplo, está faltando o start_date (não achei a data exata, a edição mais velha que consegui encontrar é a 11: https://diariomunicipalaam.org.br/visualizar-publicacao/20091023). Se a edição 11 está em outubro de 2009, a 1 deve estar por ali no meio do ano de 2009.
Interessante notar que nesse site novo, o /path é a data. No caso acima 20091023 <> 2009-10-23
Parece que a associação de municípios do Amazonas migrou de site: antes: https://www.diariomunicipal.com.br/aam; agora: https://diariomunicipalaam.org.br/
Então o raspador que temos - am_associacao_municipios.py que usa a BaseSigpub - pode não servir mais. Ao mesmo tempo, alguns elementos de página e o layout do diário parecem seguir iguais.
Tarefa
É necessário confirmar se realmente a mudança do site demanda a mudança do raspador, testando o código atual para a nova URL e, caso o código que temos não servir mais, desenvolver o raspador para o site novo.
É necessário atualizar o raspador para seguir o padrão de projeto. Por exemplo, está faltando o
start_date
(não achei a data exata, a edição mais velha que consegui encontrar é a 11: https://diariomunicipalaam.org.br/visualizar-publicacao/20091023). Se a edição 11 está em outubro de 2009, a 1 deve estar por ali no meio do ano de 2009.Interessante notar que nesse site novo, o
/path
é a data. No caso acima20091023
<> 2009-10-23