mfdz / GTFS-Issues

Documentation and Tracking of Issues in GTFS- and GTFS-RT Feeds
36 stars 3 forks source link

FlixBus/DELFI: Haltestellenname nicht valide #128

Open dancesWithCycles opened 1 year ago

dancesWithCycles commented 1 year ago

Referenz

Hallo liebe Mitmenschen, Auf der Webseite gtfs.delfi.swingbe.de fuehrt ein Report-Link zur Auswertung vom Delfi-Datensatz im GTFS-Format.

Screenshot_2023-04-02_15-53-41

Dieser Report wird jeden Dienstag und Donnerstag erstellt und ist hier abrufbar.

Beschreibe den Fehler

Die Haltestelle

"000000012215","","Inowrocław, Nr 3432C ul. Bpa. Antoniego Laubitza - Bazylika ",,"52.799743000000","18.262939000000",0,,0,"",""

beinhaltet ein Leerzeichen am Ende und der Name scheint nicht valide zu sein, wenn ich ihn mit OSM vergleiche.

Screenshot_2023-04-02_15-57-31

Screenshot_2023-04-02_15-58-15

Diese Haltestelle wird von dieser Fahrt verwendet.

"4781294_3",21523,2078129664,"Toruń, dworzec autobusowy","",0,,187886,0,1

Diese Fahrt ist in dieser Route/Linie enthalten.

"4781294_3",13794,"N1335","Torun - Berlin - Frankfurt - Paris - Troyes",3,"73D700","FFFFFF",""

Diese Linie wird dem folgenden Unternehmen zugeordnet.

13794,"FlixBus-de","https://www.delfi.de","Europe/Berlin","",""

Jetzt zu meiner Frage:

Aktualisierungszeitpunkt der GTFS-Daten:

Validator version: 3.1.1

Validation date and time: 2023-03-30 at 01:12:34 CEST

Downloadlink der GTFS-Daten:

https://de.data.public-transport.earth/gtfs-germany.zip
DELFI-Team commented 1 year ago

Hallo zusammen,

vielen Dank für den Hinweis. Wir haben haben Ihre Anfrage an das Unternehmen "Flixbus" weitergeleitet, welches uns diese ausländische Haltestelle zuliefert und verantwortlich ist. Wir sind grundsätzlich erster Ansprechpartner für den GTFS-Datensatz, weshalb standardmäßig bei Lieferanten die URL "www.delfi.de" hinterlegt ist und leiten Anfragen dann ggf. weiter.

Von Flixbus haben wir haben die folgende Rückmeldung erhalten:

Der vollständige Name der Haltestelle lautet: "Inowrocław, Nr 3432C ul. Bpa. Antoniego Laubitza - Bazylika Mniejsza pw. NMP" (insgesamt 77 Zeichen). Der Name wird aufgrund seiner Überlänge in den Daten abgeschnitten.

Systemseitig sind bei DELFI max. 30 Zeichen für Haltestellennamen möglich. Auf die Daten der "OpenStreetMap" haben wir leider keinen Einfluss. Dort gilt möglicherweise eine andere Begrenzung der max. Zeichen für Haltestellennamen.

Viele Grüße, Ihr DELFI-Team

derhuerst commented 1 year ago

Der vollständige Name der Haltestelle lautet: "Inowrocław, Nr 3432C ul. Bpa. Antoniego Laubitza - Bazylika Mniejsza pw. NMP" (insgesamt 77 Zeichen). Der Name wird aufgrund seiner Überlänge in den Daten abgeschnitten.

Für stop_name gilt laut Spezifikation:

Name of the location. The stop_name should match the agency's rider-facing name for the location as printed on a timetable, published online, or represented on signage. […]

Ich bin der Meinung, dass der stop_name der obengenannten Haltestelle nicht die Adresse ("Inowrocław, Nr 3432C ul. Bpa. Antoniego Laubitza") beinhalten sollte; Diese sollte in stop_desc untergebracht werden, welches wie folgt definiert ist:

Description of the location that provides useful, quality information. Should not be a duplicate of stop_name.

Anzumerken ist, dass der aktuelle (2023-05-02) Flix-GTFS-Feed diese Haltestelle nur (noch?) wie folgt ausweist:

stop_id,stop_name,stop_lat,stop_lon,stop_code,stop_desc,zone_id,stop_url,location_type,parent_station,wheelchair_boarding,stop_timezone,platform_code
1f2b61e4-9e6c-4a01-8f3b-c99833f1944c,"Inowrocław,  Laubitza",52.799743,18.262939,INW,,,,,,,Europe/Warsaw,
derhuerst commented 1 year ago

Systemseitig sind bei DELFI max. 30 Zeichen für Haltestellennamen möglich.

Im Jahr 2023 halte ich diese Beschränkung für nicht mehr akzeptabel:

NVBWSeifert commented 1 year ago

es gibt in unserem Fall (DIVA Release 19) 15 Formen des Haltestellennamens. die meisten Formen des Namens sind für einen speziellen Zweck (z.B. für Fahrplandruck, für DFI, für die EFA-Auskunft, etc.). Welcher der Namensfelder dann für den GTFS-Datensatz genommen wird, ist evtl. nicht einheitlich geregelt. Es kann also sein, das die Namen eines Lieferanten kürzere Namen und eine andere Form (z.B. mit oder ohne Gemeindenamen) hat als beim nächsten. Bei dem zusammenfassen in DELFI für GTFS kann da evtl. einen Mischmasch geben. Ich wollte hier nur den technischen Background im Fall der Mentz Software DIVA geben.

derhuerst commented 1 year ago

Maybe tagging someone like @jacopofar will help clarifying which formats & GTFS fields Flix can deliver to DELFI? 🤔 (Just ignore this if it seems out-of-scope to you.)

jacopofar commented 1 year ago

Answering in English for rapidity: I do not work on that but maybe can help nonetheless or report to someone who knows about it.

I don't know If I understand correctly the problem, you are asking what's the logic for the name of the station in the GTFS export? Or a way to get a short name to fit the limitation of this DELFI system?

dancesWithCycles commented 1 year ago

I don't know If I understand correctly the problem, you are asking what's the logic for the name of the station in the GTFS export? Or a way to get a short name to fit the limitation of this DELFI system?

Hi @jacopofar , That DELFI is using a 30 character long substring for the stop name when generating the GTFS export is one issue by itself that leads to invalid stop names according to GTFS validator tools and best practises.

Another issue is the data fusion at DELFI. Transport companies or associations from all over Germany are sending static transport data exports in maybe different file formats to DELFI on a regular basis. DELFI puts all that data together to a single German-wide GTFS file. Some transport companies or associations stick to the specification of stop name and some do not. That leads to odd observations like that one in this issue.

"Inowrocław, Nr 3432C ul. Bpa. Antoniego Laubitza - Bazylika "

A stop name containing an address and spaces at the end that does not comply with the specification and not with osm and maybe leads to other compatibility issues as well.

jacopofar commented 1 year ago

I see, is this data still there? The current export does seem to contain the name without the address

derhuerst commented 1 year ago

I see, is this data still there? The current export does seem to contain the name without the address

Indeed!

Regardless of DELFI's specific needs (but assuming that GTFS is the format delivered to DELFI by Flix – it may be a different one), I think it would be best for Flix's GTFS feed to follow the spec as closely as possible, namely:

Thanks for looking into this BTW!