pyHDB - Ferramenta de auxílio metodológico para pesquisas na interface da Hemeroteca Digital Brasileira da Biblioteca Nacional. Desenvolvida por Eric Brasil (IHLM-UNILAB) como parte de pesquisa acadêmica da área de História Digital.
Primeiramente, gostaria de agradecer ao Eric por essa ferramenta interessantíssima que promete facilitar bastante o meu trabalho no projeto de pesquisa no qual faço parte. Tenho tentado utilizar a ferramenta tanto com a sua opção mais geral (pyHDB.py), quanto com a opção relativa aos acervos e, em ambos os casos, não tenho conseguido obter os CSV's relativos aos resultados das ocorrências. Obtenho somente um relatório txt geral com algumas poucas informações. Abaixo, um exemplo do único arquivo que a ferramenta tem gerado, seguindo, inclusive, a reprodução de um issue já resolvido no fórum.
Reproduzir
Tenho usado as seguintes linhas de código:
cd C:\Users\FCJA_GEARQ\Desktop\pyHDB\src
python pyHDB.py e python pyHDB_acervos.py
Utilizando a numeração de acervo "103730_06", referente ao jornal "Gazeta de Notícias", e pesquisando "revolucao de outubro". Nota-se, tenho pesquisado vários termos, alguns bem gerais, outros bem específicos, e sigo sem obter os csv's de resultado e resposta da ferramenta.
Comportamento esperado
Seguindo o acompanhamento de alguns issues aqui, esperaria que a ferramenta demonstrasse, no terminal, alguma informação acerca do andamento do processo de raspagem, além dos já citados resultados em CSV.
Screenshots
Abaixo, alguns screenshots demonstrando o que venho obtendo.
Desktop (por favor, preencha as seguintes informações):
Descreva o bug
Primeiramente, gostaria de agradecer ao Eric por essa ferramenta interessantíssima que promete facilitar bastante o meu trabalho no projeto de pesquisa no qual faço parte. Tenho tentado utilizar a ferramenta tanto com a sua opção mais geral (pyHDB.py), quanto com a opção relativa aos acervos e, em ambos os casos, não tenho conseguido obter os CSV's relativos aos resultados das ocorrências. Obtenho somente um relatório txt geral com algumas poucas informações. Abaixo, um exemplo do único arquivo que a ferramenta tem gerado, seguindo, inclusive, a reprodução de um issue já resolvido no fórum.
Reproduzir
Tenho usado as seguintes linhas de código:
cd C:\Users\FCJA_GEARQ\Desktop\pyHDB\src python pyHDB.py e python pyHDB_acervos.py
Utilizando a numeração de acervo "103730_06", referente ao jornal "Gazeta de Notícias", e pesquisando "revolucao de outubro". Nota-se, tenho pesquisado vários termos, alguns bem gerais, outros bem específicos, e sigo sem obter os csv's de resultado e resposta da ferramenta.
Comportamento esperado Seguindo o acompanhamento de alguns issues aqui, esperaria que a ferramenta demonstrasse, no terminal, alguma informação acerca do andamento do processo de raspagem, além dos já citados resultados em CSV.
Screenshots
Abaixo, alguns screenshots demonstrando o que venho obtendo.
Desktop (por favor, preencha as seguintes informações):