etalab / transport-site

Rendre disponible, valoriser et améliorer les données transports
https://transport.data.gouv.fr
194 stars 30 forks source link

Ajout de filtres back-office pour identifier les GTFS à améliorer (enrichissement commercial) #2312

Closed ChristinaLaumond closed 1 year ago

ChristinaLaumond commented 2 years ago

Hello,

Comme discuté en point d'équipe, pourriez vous ajouter les filtres suivants pour retrouver les jdd facilement :

Merci beaucoup !

Christina

thbar commented 2 years ago

Note pour @etalab/transport-tech ; dans certains cas je pense que fournir une analyse ad-hoc hors backoffice nous apportera de la flexibilité (comme l'a fait @AntoineAugusti l'autre jour sur les GTFS-RT sans status updates ou similaire).

Ca permet d'utiliser des outils pratiques et variés (type Python/Ruby, ou encore LiveBook), sans chercher à déployer.

Quand ça a fait ses preuves on peut aller voir dedans.

Je m'assigne celui-là.

fchabouis commented 2 years ago

Une piste pourrait être de faire évoluer notre validateur pour qu'il sorte ces informations. Il y a aussi une petite subtilité, c'est est-ce qu'on veut les GTFS sans shapes, ou les GTFS qui ont des shapes manquantes pour certaines routes ? Le validateur est déjà capable de sortir l'info de la présence de shapes, mais pas de savoir si toutes les routes en ont. Il ne dit rien pour le moment sur les couleurs, etc. Il y a aussi des warnings existants sur des noms de routes manquantes (MissingName : An agency, a route or a stop has its name missing.), faudrait voir si c'est le long, ou le short.

thbar commented 2 years ago

Une piste pourrait être de faire évoluer notre validateur pour qu'il sorte ces informations

C'est une très bonne idée, je m'en inspire pour me dire que cibler le validateur GTFS de MobilityData (qu'on doit intégrer par ailleurs) aurait peut-être un plus gros effet de levier, puisque ça devient le validateur canonique.

En très rapide, je vois https://github.com/MobilityData/gtfs-validator/blob/master/RULES.md liste des checks déjà implémentés.

Je me demande :

Miryad3108 commented 1 year ago

On peut fermer l'issue avec l'onglet Données absentes mais possibles à modéliser en GTFS dans les détails des ressources GTFS ?

@fchabouis

fchabouis commented 1 year ago

Oui on peut je pense. Comme dit plus haut, il est plus rapide de sortir une liste de datasets à la main si c'est un besoin ponctuel. A votre disposition si besoin d'un export :) Je pense que depuis que cette issue a été ouverte, plusieurs infos supplémentaires ont été ajoutées dans les métadonnées de notre validateur.