Closed ogecece closed 7 months ago
Retirei as 3 em #1035, porém acho que temos algumas questões agora:
@trevineju mudei um pouco a busca que foi feita nos municípios e achei diários da associação tão antigos quanto 2017 ou 2018 em todos os três: Bacurituba, Feira Nova do Maranhão, Milagres do Maranhão.
Podemos remover toda a cobertura desses municípios por enquanto.
Quanto ao ponto 3, por enquanto não vejo o que fazer do lado dos raspadores pra detectar essa mudança. Penso que um ponto de detecção seria no processamento do texto do documento.
Dados foram removidos de produção. Fechando a issue.
Descobri o problema a partir de Bacurituba (MA), onde baixando as publicações vemos que são arquivos da associação de municípios e não exclusivos ao município.
Fui investigar rapidamente outros municípios com o raspador siganet como base para ver se encontrava outro caso ou se seria apenas um caso isolado.
Não vi problemas em:
Encontrei problemas em:
Proponho que todos os municípios com problemas sejam retirados de produção imediatamente.