Open hbruch opened 2 years ago
Zur Bestätigung: Ich habe stichprobenartig geschaut, im VBB-Feed kommen diese Fahrten nicht doppelt vor.
Das Problem besteht Stand heute weiterhin.
Stand der Daten: VBB: 9.12.2022 DELFI: 5.12.2022
Das Problem besteht im DELFI-Datensatz Stand 12.08.2024 weiterhin.
Wir bekommen Eisenbahnlinien in der Regel von mehreren Lieferanten und versuchen per Konfiguration jeweils genau eine in die Ausgabeschnittstellen zu übergeben. Für das konkrete Beispiel ziehen wir das nach. Die einzig wirklich effiziente Methode nach Linien-Duplikaten auf unserer Seite zu suchen, ist die deutschlandweite Linien-ID (DTID). Leider ist die Versorgung von DTID bei Eisenbahnlinien noch nicht auf dem Stand, den wir gerne hätten, sodass wir Linien- und Fahrtduplikate nie ganz ausschließen können.
Anke Beckert (DELFI-Team)
Der DELFI-GTFS-Datensatz beinhaltet mehrere grundsätzlich äquivalente Trips mehrfach. Mutmaßliche Ursache sind in den vermutlich aus unterschiedlichen Quellen stammenden Fahrten teilweise abweichende Steige, z.B. bei unten stehenden Fahrten.
Beispiele
...
Behebungsvorschlag Bei der Ermittlung von Äquivalenten ist es womöglich sinnvoller, statt auf steigscharfe Identität zu vergleichen (was ich als aktuelle Ursache vermute), auf Äquivalenz der übergeordneten Haltestellen-ID zu prüfen (ohne Steig). Dabei sollten festgestellte Differenzen an die Datenbereitstellenden rückgemeldet werden, da zumindest eine Quelle fehlerhaft sein dürfte.
Aktualisierungszeitpunkt der GTFS-Daten: 21.03.2022
Downloadlink der GTFS-Daten: oepnv-opendata