marians / cologne-ris-scraper

A python-based scraper for the Ratsinformationssystem (RIS) of Cologne, Germany
14 stars 4 forks source link

Geladenen Dokumententyp verifizieren #6

Closed marians closed 11 years ago

marians commented 12 years ago

Wenn ein Attachment herunter geladen wird, kommt es in einzelnen Fällen dazu, dass statt dem erwarteten PDF eine Fehlermeldung vom Typ text/html ausgegeben wird.

Vor dem Ablegen des Attachments sollte noch mal überprüft werden, ob die Datei tatsächlich den erwarteten Inhaltstyp hat. Dazu können beispielsweise die filteutils genutzt werden.