FelixFrog / pdfgrabber

Download PDF books from bSmart, Pearson, Oxford, and many more!
GNU Affero General Public License v3.0
114 stars 16 forks source link

problema su hubscuola #88

Closed sefirothmorpheus closed 2 months ago

sefirothmorpheus commented 5 months ago

primo libro Cattura

secondo libro Cattura

terzo libro Cattura

Idontgivefuck commented 4 months ago

Ciao @sefirothmorpheus

Attualmente sembrerebbe che il developer non abbia ancora effettuato un aggiornamento per risolvere questo bug. Tuttavia ho riscontrato i tuoi stessi medesimi errori e ho provveduto ad aggiornare autonomamente il file hbs.py aggiungendo delle funzioni di debug che mi hanno permesso di capire cosa succedeva quando il software incappava in quest'errore. Sembrerebbe che quando lo script va a cercare la lista degli ID dei capitoli da scaricare, trovi anche degli ID su cui non viene permesso il download dello zip file perchè semplicemente viene restituito un codice di NOT FOUND sul server Hub Scuola. Percui l'unico fix che ho potuto inserire è stato quello di skippare questi capitoli, quindi ho aggiunto una funzione che gestisce questo errore. Probabilmente sono dei capitoli "fantasma" che effettivamente non contengono pagine rilevanti anche perchè sia da quello che ho riscontrato io, sia da quello che vedo nelle tue foto sembrerebbe un errore che avviene esclusivamente nel rendering delle ultime pagine del libro, se non proprio sull'ultima pagina. Se vuoi essere sicuro che ci siano tutte le pagine confronta la versione dell'Hub Young reader con quella scaricata in modo da accertare che effettivamente ci siano tutte le pagine e fammelo sapere in modo tale che posso finalmente confermare la mia teoria che quei capitolo semplicemente sono vuoti. Prima che scoprissi questo software utilizzavo un altro metodo per scaricare libri di Hub Scuola, scaricavo su Windows l'applicazione Hub Young, mi loggavo, scaricavo al 100% il libro che volevo consultare e poi andando nella cartella C:\Users\\AppData\Local\HUB young.v2, trovavo una cartella con l'id corrispondente al libro e cliccando avevo delle sottocartelle che rappresentavano i vari capitoli in cui all'interno vi erano dei file PDF delle varie pagine del capitolo. Semplicemente tramite Adobe convertivo tutti quei piccoli PDF in un unico grande PDF e avevo il libro. In caso ne avessi bisogno sentiti libero anche di usare questo metodo, soprattutto se l'errore avviene durante il rendering di capitoli che poi effettivamente contengono delle pagine, che però il mio script salta (ripeto per ora avviene solo nell'ultima pagina dell'ultimo capitolo, però non si sa mai) :) Spero di essere stato chiaro durante la spiegazione (probabilmente no), per qualsiasi altra informazione o comunque per qualsiasi altro aggiornamento per capire se questo script aggiornato funziona anche per te fammelo sapere

Ecco a te comunque il file aggiornato hbs.py (ricordati di sostituirlo con quello preesistente) hbs.zip

FelixFrog commented 2 months ago

Grazie per la segnalazione e grazie per @Idontgivefuck per averci dato un'occhiata. Se @ruryx00 o @sefirothmorpheus mi possono contattare su telegram a t.me/fflxx proverò a implementare una soluzione che non rischi di scartare del contenuto valido

ruryx00 commented 2 months ago

ciao @FelixFrog , ho cancellato il mio commento perché sono riuscito a far funzionare il fix su un altro computer. l'errore che avevo riscontrato probabilmente era legato al conflitto di roba nella mia installazione di python. grazie mille per il fix @Idontgivefuck

Idontgivefuck commented 2 months ago

Grazie per la segnalazione e grazie per @Idontgivefuck per averci dato un'occhiata. Se @ruryx00 o @sefirothmorpheus mi possono contattare su telegram a t.me/fflxx proverò a implementare una soluzione che non rischi di scartare del contenuto valido

Figurati grazie a te per i tuoi continui update a questo progetto

Idontgivefuck commented 2 months ago

ciao @FelixFrog , ho cancellato il mio commento perché sono riuscito a far funzionare il fix su un altro computer. l'errore che avevo riscontrato probabilmente era legato al conflitto di roba nella mia installazione di python. grazie mille per il fix @Idontgivefuck

Sono felice che tu abbia risolto il problema

FelixFrog commented 2 months ago

L'ultimo commit dovrebbe aver risolto il problema. @Idontgivefuck @ruryx00 potreste confermare che il fix "ufficiale" funziona? Per ora chiudo già la issue