etalab / transport-site

Rendre disponible, valoriser et améliorer les données transports
https://transport.data.gouv.fr
193 stars 30 forks source link

Validation GTFS RENFE valeur route_long_name vide devrait être OK #4242

Open cyrilmorin opened 1 week ago

cyrilmorin commented 1 week ago

Hello,

Le GTFS RENFE est considéré comme non valide et il y a à priori 2 raisons différentes (à minima) Pouvez-vous me confirmer que j'interprète bien les erreurs si oui pour que je puisse répondre au producteur ?

1- calendar_dates.txt est vide et sans même le nom des champs. Le fait de na pas avoir le titre des champs est bien la source de la non-conformité ? 2- J'ai voulu testé rapidos et j'ai supprimé calendar_dates (calendar.txt OK) et j'ai une autre erreur stipulant que le nom des Routes était manquant. (cf rapport_test) En regardant il n'y a pas de route_long_name mais bien de route short name. Pas idéal en général mais pratique déjà vu sur le ferré. la spec prévoit bien la possibilité de remplir l'un ou l'autre tant que les 2 ne sont pas vides

route_id,agency_id,route_short_name,route_long_name,route_desc,route_type,route_url,route_color,route_text_color
6000087089AV016,1071,AVE INT,,,2,,F2F5F5,
6000071801AV016,1071,AVE INT,,,2,,F2F5F5,
0430787089AV016,1071,AVE INT,,,2,,F2F5F5,
8708960000AV016,1071,AVE INT,,,2,,F2F5F5,
8708904307AV016,1071,AVE INT,,,2,,F2F5F5,
7180160000AV016,1071,AVE INT,,,2,,F2F5F5,
7180187303AV016,1071,AVE INT,,,2,,F2F5F5,
0430787303AV016,1071,AVE INT,,,2,,F2F5F5,
8730371801AV016,1071,AVE INT,,,2,,F2F5F5,
8730304307AV016,1071,AVE INT,,,2,,F2F5F5,

Merci !

Cyril

ptitfred commented 1 week ago

Pouvez-vous me confirmer que j'interprète bien les erreurs si oui pour que je puisse répondre au producteur ?

Je te confirme que le validateur attend à la fois les noms long et court. Je n'ai pas vérifié dans la specification ce qu'il en est, mais ça semble être une limitation de notre validateur.

ptitfred commented 1 week ago

A noter qu'il y a encore un mois, ce n'était considéré que comme un warning. C'est désormais une erreur.

cyrilmorin commented 1 week ago

OK merci @ptitfred pour cette précision, on pourra en reparler avec @AntoineAugusti, il y a peut-être une raison car c'est une limitation qui va au-delà de la spec {2198756B-6733-4B20-8251-7BFD8C159B75}

Merci

ptitfred commented 1 week ago

@cyrilmorin je suis d'accord ; j'ai ouvert une issue et proposé un fix sur le validateur.

AntoineAugusti commented 1 week ago

@ptitfred Merci Frédéric pour l'analyse et le fix ! En effet le fonctionnement a changé récemment : avant on levait un avertissement quand le long ou le court n'était pas renseigné, on est passés récemment à un niveau d'erreur pour cette absence d'info et la règle aurait dû être adaptée. Je n'avais pas relevé ça, navré.

PS : quand la PR sera mergée et la nouvelle version du validateur déployée tu peux aller sur le BO et cliquer sur le bouton "Validateur GTFS Transport - Validation forcée" pour relancer une validation de tous les GTFS avec la nouvelle version du validateur.

cyrilmorin commented 1 week ago

Pour la question 1- vous confirmez également que c'est bien le problème ? _1- calendardates.txt est vide et sans même le nom des champs. Le fait de na pas avoir le titre des champs est bien la source de la non-conformité ? Merci les gars

AntoineAugusti commented 1 week ago

1- calendar_dates.txt est vide et sans même le nom des champs. Le fait de na pas avoir le titre des champs est bien la source de la non-conformité ?

Oui, les noms des champs doivent être présents.

The first line of each file must contain field names.

Source : https://gtfs.org/documentation/schedule/reference/#file-requirements

cyrilmorin commented 1 week ago

Pour info, producteur contacté via Front pour résoudre le souci de calendar_dates.txt

ptitfred commented 1 week ago

PS : quand la PR sera mergée et la nouvelle version du validateur déployée tu peux aller sur le BO et cliquer sur le bouton "Validateur GTFS Transport - Validation forcée" pour relancer une validation de tous les GTFS avec la nouvelle version du validateur.

C'est en cours.

cyrilmorin commented 1 week ago

juste pour info le GTFS a été corrigé et tout semble OK pour la RENFE