mfdz / GTFS-Issues

Documentation and Tracking of Issues in GTFS- and GTFS-RT Feeds
35 stars 3 forks source link

DELFI: transfers.txt enthält undefinierte stop-IDs #81

Closed derhuerst closed 2 years ago

derhuerst commented 2 years ago

transfers.txt enthält stop-IDs in from_stop_id & to_stop_id, die nicht in stops.txt definiert sind:

xsv join --left from_stop_id transfers.txt stop_id stops.txt | xsv search -s stop_id '^$' | xsv select 1-8
# from_stop_id,to_stop_id,transfer_type,min_transfer_time,from_route_id,to_route_id,from_trip_id,to_trip_id
# 000300164014,de:11000:900029101_G,2,360,,,,
# 000300164016,de:11000:900029101_G,2,360,,,,
xsv join --left to_stop_id transfers.txt stop_id stops.txt | xsv search -s stop_id '^$' | xsv select 1-8
# from_stop_id,to_stop_id,transfer_type,min_transfer_time,from_route_id,to_route_id,from_trip_id,to_trip_id
# de:11000:900029101_G,000300164014,2,360,,,,
# de:11000:900029101_G,000300164016,2,360,,,,

Aus dem transfers.txt-Spec:

from_stop_id, ID referencing stops.stop_id, Required [...] to_stop_id, ID referencing stops.stop_id, Required [...]

Aktualisierungszeitpunkt der GTFS-Daten:

Ich nutze den DELFI-Datensatz vom 12.11.21:

shasum gtfs-germany.zip
# 9fa29949bca105d133b8fbc464edc250ad51fdfa  gtfs-germany.zip
       480 Nov 19 09:47 ./
      1920 Nov 19 09:47 ../
    184748 Nov 12 11:56 Beschreibung_DELFI-Datensatz_GTFS_20211112.pdf
     79860 Nov 12 14:22 agency.txt
    274198 Nov 12 14:22 calendar.txt
    917198 Nov 12 14:22 calendar_dates.txt
        64 Nov 12 14:22 frequencies.txt
       110 Nov 12 14:22 levels.txt
  21576510 Nov 12 14:22 pathways.txt
    991409 Nov 12 14:22 routes.txt
 247324824 Nov 12 14:22 shapes.txt
1958729470 Nov 12 14:22 stop_times.txt
  49301878 Nov 12 14:22 stops.txt
  51344806 Nov 12 14:22 transfers.txt
 107676619 Nov 12 14:22 trips.txt

Downloadlink der GTFS-Daten:

https://de.data.public-transport.earth/gtfs-germany.zip

Busfahrer795 commented 2 years ago

Hallo, das ist leider ein bekanntes Problem. Wir haben die Tage ein Update unseres Exports bekommen. Dieser ist noch in der Abnahmephase bei uns. Aber damit sollte das Problem der unbekannten stop_ids hoffentlich behoben sein.

derhuerst commented 2 years ago

Gibt es automatisierte Vorkehrungen, wie etwa ein Validierungs-Script, die sicherstellen, dass dieser Fehler nicht wieder auftritt?

hbruch commented 2 years ago

Problem besteht bei Datensatz vom 26.11.2021 weiterhin.

Busfahrer795 commented 2 years ago

Ja. Das neue Release ist weiterhin nicht für die Produktion freigegeben.

derhuerst commented 2 years ago

Mit dem DELFI-Datensatz vom 21.03.2022 erhalte ich keine solcher Zeilen mehr:

shasum gtfs-germany.zip
# eed05c34821e65205acbd3f05f9b0b4dde746a6e  gtfs-germany.zip

qsv join --left from_stop_id transfers.txt stop_id stops.txt | qsv search -s stop_id '^$' | qsv select 1-8
# from_stop_id,to_stop_id,transfer_type,min_transfer_time,from_route_id,to_route_id,from_trip_id,to_trip_id
qsv join --left to_stop_id transfers.txt stop_id stops.txt | qsv search -s stop_id '^$' | qsv select 1-8
# from_stop_id,to_stop_id,transfer_type,min_transfer_time,from_route_id,to_route_id,from_trip_id,to_trip_id
hbruch commented 2 years ago

Fehler scheint behoben