Open marians opened 11 years ago
Ist eventuell obsolet, wenn die Job Queue (#16) realisiert ist und Jobs nur dann entfernt werden, wenn sie erfolgreich erledigt wurden.
Spaßig, dass Dir das auch aufgefallen ist: genau das Problem habe ich bei Duisburg durch einen recht direkten Fix gelöst - es wird in der OpenRuhr Version exakt drei mal probiert bis er aufgibt und einen Fehler schmeisst.
Heißt das, es wird einfach dreimal hintereinander dieselbe URL aufgerufen? Mit oder ohne Wartezeit?
Mit Wartezeit und es wird explizit nach dem Fehler gesucht. Ist dieses Commit hier: https://github.com/OpenRuhr/ris-scraper/commit/0078b15c151bf8d8d4e16ba55f4c7d730642fbac , vor allem Zeile 411 und 429ff. Sieht durch die zusätzlichen Tabs aus wie eine Riesen-Änderung, sind aber nur ein paar Zeilen + Tabs.
Es kommt vor, dass Seiten nicht korrekt geladen werden und dann trotzdem versucht wird, Inhalte darin zu finden. Ein Beispiel für die Fehlerausgabe in diesem Fall:
Es wäre sinnvoll, diesen Fall abzuwenden, in dem man genauer prüft, ob die Seite vollständig geladen wurde (wie kann man das machen?) und ggf. einen weiteren Request nach kurzer Wartezeit startet.