mfdz / GTFS-Issues

Documentation and Tracking of Issues in GTFS- and GTFS-RT Feeds
36 stars 3 forks source link

DELFI: Nahezu alle Steige eines Haltes haben jeweils gleiche Position #44

Open hbruch opened 4 years ago

hbruch commented 4 years ago

Art der Abweichung Nahezu alle Steige eines jeden Haltes sind jeweils mit der gleichen Koordinate angegeben. Damit ist ein aussagekräftiges Fußgänger-Routing ebensowenig möglich wie eine korrekte Kartenanzeige.

Dies ist umso unverständlicher, als dem DELFI e.V. mit dem zentralen Haltestellenverzeichnis die steigscharfen Koordinaten bekannt sind.

Referenz Laut GTFS Best Practices:

Stop locations should be as accurate possible. Stop locations should have an error of no more than four meters when compared to the actual stop position.

Aktualisierungszeitpunkt der GTFS-Daten:

  1. April 2020

Downloadlink der GTFS-Daten: https://cms.opendata-oepnv.de/fileadmin/datasets/delfi/20200409_fahrplaene_gesamtdeutschland_gtfs.zip

hbruch commented 4 years ago

Mit Stand 17.4.2020 ist die Anzahl von Steigen mit gleicher Koordinate zwar geringer, jedoch hat nach wie vor mehr als die Hälfte aller Steige die gleichen Koordinaten:

SELECT COUNT(*)
  FROM gtfs.stops a
 WHERE a.location_type IS NULL OR a.location_type=0;

 count
--------
 392375

SELECT COUNT(DISTINCT a.stop_id)
  FROM gtfs.stops a
  JOIN gtfs.stops b ON a.parent_station = b.parent_station
 WHERE a.stop_id != b.stop_id
   AND a.location_type IS NULL
   AND b.location_type IS NULL
   AND a.stop_lon = b.stop_lon
   AND a.stop_lat = b.stop_lat;

 count
--------
 217609
hbruch commented 4 years ago

Dies gilt weiterhin für die überwiegende Mehrheit der Haltestellen des Datenbestands vom 30.4.2020 (mit location_type=0 ausgewertet):

SELECT COUNT(DISTINCT a.stop_id)
   FROM gtfs.stops a
   JOIN gtfs.stops b ON a.parent_station = b.parent_station
  WHERE a.stop_id != b.stop_id
    AND a.location_type = 0
    AND b.location_type = 0
    AND a.stop_lon = b.stop_lon
    AND a.stop_lat = b.stop_lat;

 count
--------
 299109
hbruch commented 4 years ago

Dies gilt weiterhin für die überwiegende Mehrheit der Haltestellen des Datenbestands vom 08.05.2020 (mit location_type=0 ausgewertet):

 count
--------
 284641
hbruch commented 4 years ago

Dies gilt weiterhin für 61575 Haltestellen des Datenbestands vom 15.05.2020.

derhuerst commented 2 years ago

Mit dem DELFI-Datensatz vom 21.03.2022:

SELECT COUNT(DISTINCT a.stop_id)
FROM stops a
JOIN stops b ON a.parent_station = b.parent_station
WHERE a.stop_id != b.stop_id
AND a.location_type = 'stop' -- 0
AND b.location_type = 'stop' -- 0
AND a.stop_loc = b.stop_loc
-- count
-- 830
hbruch commented 3 months ago

Mit dem DELFI-Datensatz vom 12.08.2024:

SELECT COUNT(DISTINCT a.stop_id)
     FROM gtfs.stops a
     JOIN gtfs.stops b ON a.parent_station = b.parent_station
    WHERE a.stop_id != b.stop_id
      AND a.location_type = 0
      AND b.location_type = 0
      AND a.stop_lon = b.stop_lon
      AND a.stop_lat = b.stop_lat;
┌───────────────────────────┐
│ count(DISTINCT a.stop_id) │
│           int64           │
├───────────────────────────┤
│                      1175 │
└───────────────────────────┘