marians / offeneskoeln

Software backend of offeneskoeln.de
16 stars 9 forks source link

Abbruch in solr_import.py #67

Closed marians closed 11 years ago

marians commented 11 years ago

Seit dem letzten Scrapen läuft der Solr-Import nicht durch. Es liegt offensichtlich an einem Dokument ohne "reference".

7618 von 25235 (30.19%) - reference: None
Traceback (most recent call last):
  File "/home/ok/offeneskoeln/scripts/solr_import.py", line 424, in <module>
    import_doc(reference, verbose=options.verbose, streets=streets)
  File "/home/ok/offeneskoeln/scripts/solr_import.py", line 366, in import_doc
    title=documents[0]['title'].decode('utf-8'),
IndexError: list index out of range

In der Tabelle "submissions" gibt es exakt einen Eintrag mit submission_id=395371, bei dem alle Felder mit Ausnahme von submission_id leer sind. Der sollte da natürlich gar nicht drin stehen, zumal die dazugehörige Vorlage im RIS nicht abrufbar ist.

http://ratsinformation.stadt-koeln.de/vo0050.asp?__kvonr=395371

Davon abgesehen sollte die Datenbank-Abfrage in solr_import.py so geändert werden, dass Einträge mit submission_id=NULL gar nicht in angefasst werden.