marians / cologne-ris-scraper

A python-based scraper for the Ratsinformationssystem (RIS) of Cologne, Germany
14 stars 4 forks source link

Attachments zu Vorlagen werden nicht geladen #15

Open marians opened 11 years ago

marians commented 11 years ago

In diesem Fall wird der Dateianhang, der auf der Vorlagen-Detailseite verlinkt ist, nicht in die Datenbank geschrieben:

http://ratsinformation.stadt-koeln.de/vo0050.asp?__kvonr=38440

Die Vorlage hat 1 Anhang (ID 395371). Die Datei wird auch angelegt (http://offeneskoeln.de/attachments/1/7/pdf395371.pdf), aber bekommt keinen DB-Eintrag in "attachments".

marians commented 11 years ago

Interessanterweise funktioniert es, wenn man die Vorlage direkt über den folgenden Befehl scrapet:

python scrape.py -v --submission=38440

Die Augabe:

Lade Vorlage 38440 http://ratsinformation.stadt-koeln.de/vo0050.asp?__kvonr=38440
Anhänge: [
    {
        "linktitle": "Anfrage der SPD-Fraktion [PDF,\u00a0177\u00a0KB]", 
        "formname": "pdf395371"
    }
]
Anzahl Anhänge zu laden: 1
Lade Anhang pdf395371
Datei /home/ok/offeneskoeln/webapp/attachments/1/7/pdf395371.pdf bleibt unverändert
Schreibe Eintrag attachment_id=395371 in Tabelle 'attachments'
Beratungsfolge Vergangenheit: 0 Eintraege: []
attachments_loaded :  1
attachments_replaced :  0
attachments_new :  0
bytes_loaded :  181576