nadia-aguiar / praktikum_dh_2022

0 stars 2 forks source link

Revisão e sugestões #4

Closed ericbrasiln closed 1 year ago

ericbrasiln commented 1 year ago

Olá @nadia-aguiar

Parabéns pelo trabalho! O código está funcionando bem e deu certo em mais duas revistas.

Fiz uma revisão geral e registrei aqui.

Arquivo requirements.txt

erro com firefox.quit()

line 208, in <module>
    firefox.quit()
AttributeError: 'Options' object has no attribute 'quit'

Função save_files_pdf()

Erros ao tentar baixar pdf:

problema com nomes dos pdfs

Revistas testadas além da aceno

Funcionaram corretamente com a coleta dos dados, mas não baixou os pdfs corretamente. Não consegui identificar o motivo. Acredito que seja com o link do pdf.

Afro-Ásia: https://periodicos.ufba.br/index.php/afroasia/issue/archive Repam: https://periodicos.unb.br/index.php/repam/issue/archive

nadia-aguiar commented 1 year ago

Oi, Eric.

Estava aqui pensando como ocorreu esse problema se o modo de escrite é a...Você tem uma explicação? Obrigada!

"problema com nomes dos pdfs

pdfs antigos da revista aceno possui incoerências e seus títulos: muitos pdfs com o mesmo nome. Isso faz com que o programa substitua o pdf antigo pelo novo. Isso pode ser resolvido com a inclusão de um número sequencial no nome do arquivo. Ex: nome_1.pdf, nome_2.pdf, nome_3.pdf etc. Fiz isso criando o self.id_number que é incrementado a cada iteração do loop na função de download de pdfs."