ericbrasiln / pyHDB

pyHDB - Ferramenta de auxílio metodológico para pesquisas na interface da Hemeroteca Digital Brasileira da Biblioteca Nacional. Desenvolvida por Eric Brasil (IHLM-UNILAB) como parte de pesquisa acadêmica da área de História Digital.
https://ericbrasiln.github.io/pyHDB/
MIT License
7 stars 8 forks source link

[BUG] Ferramenta não concluindo raspagem #24

Open josemiguel2001 opened 2 weeks ago

josemiguel2001 commented 2 weeks ago

Descreva o bug

Primeiramente, gostaria de agradecer ao Eric por essa ferramenta interessantíssima que promete facilitar bastante o meu trabalho no projeto de pesquisa no qual faço parte. Tenho tentado utilizar a ferramenta tanto com a sua opção mais geral (pyHDB.py), quanto com a opção relativa aos acervos e, em ambos os casos, não tenho conseguido obter os CSV's relativos aos resultados das ocorrências. Obtenho somente um relatório txt geral com algumas poucas informações. Abaixo, um exemplo do único arquivo que a ferramenta tem gerado, seguindo, inclusive, a reprodução de um issue já resolvido no fórum.

informações incompletas - relatório

Reproduzir

Tenho usado as seguintes linhas de código:

cd C:\Users\FCJA_GEARQ\Desktop\pyHDB\src python pyHDB.py e python pyHDB_acervos.py

Utilizando a numeração de acervo "103730_06", referente ao jornal "Gazeta de Notícias", e pesquisando "revolucao de outubro". Nota-se, tenho pesquisado vários termos, alguns bem gerais, outros bem específicos, e sigo sem obter os csv's de resultado e resposta da ferramenta.

Captura de tela 2024-10-15 111618

Comportamento esperado Seguindo o acompanhamento de alguns issues aqui, esperaria que a ferramenta demonstrasse, no terminal, alguma informação acerca do andamento do processo de raspagem, além dos já citados resultados em CSV.

Screenshots

Abaixo, alguns screenshots demonstrando o que venho obtendo.

Captura de tela 2024-10-15 112624

Desktop (por favor, preencha as seguintes informações):

farnathan commented 1 week ago

Estou com o mesmo problema.