Imprensa-Nacional / inlabs

O objetivo do INLABS é permitir o acesso aos arquivos das edições completas do Diário Oficial da União, em formato PDF e XML, que é livre e gratuito desde o dia 1º de janeiro de 2020.
https://inlabs.in.gov.br
40 stars 9 forks source link

Bug? #3

Closed bortotti closed 3 years ago

bortotti commented 3 years ago

ACHO que é um bug (pode ser só inaptidão minha), então na dúvida estou reportando: pra permitir baixar as publicações de outros dias, fiz o seguinte:

Linha 1: from datetime import date, timedelta Linha 30: val = int(input("Digite o dia desejado (zero para hoje):")) diaa = date.today() - timedelta(days=val) dia = diaa.strftime("%d")

Não alterei mais nada (fora usuário/senha e quais seções quero). Testei pra dias úteis e funcionou OK. No entanto, pra fds (quando não há publicação), ele simplesmente baixa .zips de todas as seções do filtro que são "arquivos inválidos" [Erro de pastas compactadas (zipaddas) - O Windows não pode abrir a pasta. A pasta compactada (caminho) é invalida.]

Se for erro do BIOS, desconsiderem.

Muito obg!

P.S.: Há alguma chance de tirar uma dúvida na leitura do .HTML da busca, pra conseguir fazer scrap das publicações já filtradas? obg!

Iakim commented 3 years ago

Olá! Boa noite!

Quanto aos dias onde não há publicação é necessário realizar uma validação, neste caso para saber se há ou não uma publicação e após isso realizar o download ou não.

Para mais dúvidas sobre o HTML entre em contato com o e-mail inlabs@in.gov.br, ou poste neste mesmo forum sua dúvida.

Iakim commented 3 years ago

Não é BUG é BIOS!