etalab / transport-site

Rendre disponible, valoriser et améliorer les données transports
https://transport.data.gouv.fr
190 stars 29 forks source link

Retours réutilisateurs sur le validateur GTFS #2331

Closed Miryad3108 closed 2 years ago

Miryad3108 commented 2 years ago

Instant System, Maël Le Bronnec

ID :

Il serait utile d'enrichir un peu les contrôles de type "INFO" qualitatif métier : même si le GTFS est exploitable, il y a plein de points qui peuvent le rendre de qualité médiocre :

La limite de taille du validateur peut les handicaper : ils ont parfois rencontré des GTFS de 250mo Ils utilisent aussi celui (open source) de Mecatran, qui implémente d'autres controles que les notres https://gtfsvtor.mecatran.com/utw-test/web/pub/gtfsvtor

AntoineAugusti commented 2 years ago

Pr for ID with non-ASCII characters is here https://github.com/etalab/transport-validator/pull/119

AntoineAugusti commented 2 years ago

@etalab/transport-bizdev On peut avoir des infos supplémentaires sur l'importance d'avoir routes.txt route_long_name ? Le route_short_name apparait suffisant.

Miryad3108 commented 2 years ago

Demande faite auprès du réutilisateur. Je mettrai son retour ici.

Miryad3108 commented 2 years ago

@AntoineAugusti Retours du réutilisateur :

"ce point n'est pas bloquant pour nous, mais il est important pour la qualité du service : les utilisateurs doivent retrouver dans leurs médias les mêmes informations qu'ils voient sur le quai, sur le bus, sur les plans affichés, etc. Le LONG NAME diffère pas mal d'un réseau à l'autre : la façon de le construire, le choix du séparateur, etc : quand on essaye de le deviner à partir des terminus, le résultat diffère toujours du terrain. Donc nous n'essayons même pas, c'est au Transporteur de nommer ses lignes comme il le souhaite, en cohérence avec ses autres affichages. En PJ deux exemples concrets et bien différents. Vous noterez les lignes en gris, qui n'ont ni couleur, ni Long Name : bon courage aux utilisateurs ;)"

Screenshot_20220427-161507 Screenshot_20220427-161816

AntoineAugusti commented 2 years ago

@Miryad3108 Pourrais-tu donner le long route short name afin de bien comprendre la seule info disponible ? Juste "26" ou "30" pour le réseau Astuce de Rouen ?

AntoineAugusti commented 2 years ago

Depuis https://transport.data.gouv.fr/datasets/donnees-en-temps-reel-des-lignes-26-et-30-du-reseau-astuce-metropole-rouen-normandie/

routes.txt

route_id,agency_id,route_short_name,route_long_name,route_desc,route_type,route_url,route_color,route_text_color
26,760,26,26,,3,,,
30,760,30,30,,3,,,
Miryad3108 commented 2 years ago

Je demande confirmation mais ma compréhension c'est que

AntoineAugusti commented 2 years ago

@Miryad3108 Pour le cas des lignes 26 et 30 à Rouen, le GTFS https://github.com/etalab/transport-site/issues/2331#issuecomment-1111152211 a des valeurs de route_short_name et route_long_name présentes, mais les valeurs ne sont pas idéales.

Dans ce cas, je me demande si un processus automatisé (genre validateur) doit trouver quelque chose à dire.

Pourquoi le réutilisateur n'a pas posté de commentaire / pris contact avec le producteur pour demander une correction ?

Je me demande ce qui doit relever de règles de vérifications automatisées (surtout des choses arbitraires de styles) et d'un dialogue (si possible ouvert) avec les producteurs de données.

AntoineAugusti commented 2 years ago

cc @ChristinaLaumond qui a des connaissances côté SAE et intégration avec des calculateurs d'itinéraires.

ChristinaLaumond commented 2 years ago

hello, désolée je ne suis pas encore adepte de Github et je loupe donc la majorité des commentaires où on me taggue :D Globalement, j'ai l'impression que nous devons faire progresser les producteurs de données dans l'enrichissement commercial de leurs GTFS.

Pour cela, il faut qu'ils passent de la logique "un GTFS = de la donnée technique / de l'opendata / une obligation" à " un GTFS = une information voyageurs réutilisée donc un impact commercial, donc il faut que je l'enrichisse au maximum et que cela soit cohérent entre l'information voyageurs papier sur les fiches horaires et l'info voyageurs digitale"

Comme le précise Mael, le sujet est donc avant tout un sujet côté transporteur qui a le devoir de fournir une donnée la plus qualitative possible et qui représente le mieux leur info voyageurs sur le réseau. Ainsi, il n'y a pas réellement de règles sur le nom long et le nom court dans le GTFS par exemple. -> si je prends l'exemple du réseau de Quimperlé RATP DEV, je les avais sensibilisé sur le nom court et long mais leurs lignes interurbaines étaient tellement complexes (plusieurs destinations) qu'ils avaient préféré garder en nom long "Ligne 1" "Ligne 2" plutôt que "Ligne 1 - Mairie <-> Gare" par exemple. Cela dépend aussi de leur communication plus globale dans le réseau / leurs fiches horaires sur les poteaux d'arrêts, fiches horaires distribuées, plans etc.

De ce que j'ai pu voir pour le moment, j'ai l'impression :

Finalement, pour avancer sur ce sujet, je vois plusieurs pistes :

C'est un peu long mais ca mérite probablement une discussion tous ensemble pour voir le plan d'actions ;)

AntoineAugusti commented 2 years ago

Je ferme, les demandes initiales ont été prises en compte / les tickets ont été ouverts sur le validateur.