FelixFrog / pdfgrabber

Download PDF books from bSmart, Pearson, Oxford, and many more!
GNU Affero General Public License v3.0
114 stars 16 forks source link

errore su pagine di libri: non tutto viene stampato sulla pagina #78

Open sefirothmorpheus opened 8 months ago

sefirothmorpheus commented 8 months ago

ciao ho notato vari errori di scrittura. in questa immagine, un confronto tra il libro in pdf e la versione hoepliacademy+ (ma succede praticamente su tutte le piattaforme: ad esempio su hubscuola, alcune volte ci sono quadrati neri su scritte o immagini)

pdf vs hoepliacademy+

è come se il tool non aspettasse il caricamento delle pagine e/o il programma che stampa in pdf non riesce a catturare tutto

sefirothmorpheus commented 6 months ago

ciao, da quello che ho capito con altri tools, questi errori di scrittura sono dovuti a pymupdf mentre non si hanno problemi con pdf-lib si potrebbe cambiare il tool in modo che usi pdf-lib e quindi evitare questi errori di stampa? grazie

FelixFrog commented 6 months ago

Primaditutto assicurati di avere la versione più recente di pymupdf dando il comando pip install --upgrade -r requirements.txt e fai un altro tentativo. Se trovi ancora errori di questo tipo nel tuo file di configurazione config.ini prova a impostare EzSave = no e Compress = no e fammi sapere se risolve l'errore.

sefirothmorpheus commented 5 months ago

ciao, ho eseguito il comando pip install --upgrade -r requirements.txt e sembrerebbe che adesso funziona bene: pag120 proverò anche su altri libri su cui avevo errore e in caso segnalo grazie

sefirothmorpheus commented 3 months ago

ciao giusto per segnalare che l'errore si era ripresentato

image

ma ho risolto impostando EzSave e Compress sui valori "no" (invece di "yes") come da te suggerito

image

FelixFrog commented 3 months ago

Ciao! Questo è un bug di Mupdf che potrebbe essere risolto nell'ultima versione (che pdfgrabber non usa). Se invece il bug esiste anche nell'ultima versione, vorrei riportarlo upstream. Potresti mandarmi il pdf del libro in questione su telegram?

sefirothmorpheus commented 3 months ago

Ciao! Questo è un bug di Mupdf che potrebbe essere risolto nell'ultima versione (che pdfgrabber non usa). Se invece il bug esiste anche nell'ultima versione, vorrei riportarlo upstream. Potresti mandarmi il pdf del libro in questione su telegram?

si, sto usando la versione precedente. Ho scaricato la nuova versione, ma quando eseguo il comando "pip install -r requirements.txt", appare il seguente:

Installing collected packages: pymupdf, pyee, pycryptodome, mdurl, lxml, idna, greenlet, charset-normalizer, certifi, requests, playwright, markdown-it-py, rich WARNING: Failed to write executable - trying to use .deleteme logic ERROR: Could not install packages due to an OSError: [WinError 2] Impossibile trovare il file specificato: 'C:\Python312\Scripts\pymupdf.exe' -> 'C:\Python312\Scripts\pymupdf.exe.deleteme'