etalab / transport-profil-netex-fr

Le contenu des normes des données de transport présentes sur le site https://normes.transport.data.gouv.fr.
https://normes.transport.data.gouv.fr
12 stars 9 forks source link

Structure des fichiers - Archive ZIP #122

Open TuThoThai opened 3 weeks ago

TuThoThai commented 3 weeks ago

Questions à résoudre :

albanpeignier commented 3 weeks ago

Le nom de l’archive

Imposer un nom de l'archive globale est une très mauvaise idée.

C'est seulement nécessaire quand on imagine gérer un répertoire avec des fichiers.

Cette approche n'est plus très en vogue dans les architectures modernes. La plupart des usages passent par des APIs pour qui le nom du fichier n'a aucune importance.

Si quelqu'un en a besoin… il trouvera surement les ressources pour le spécifier selon son usage.

thbar commented 3 weeks ago

J'éviterais d'autoriser des zips de zips. Ca complique l'ingestion des données (il est relativement aisé de "streamer" c'est à dire lire sans décompresser, une archive, mais plus compliqué de gérer le cas où on doit faire cela recursivement).

À l'inverse je serais assez tenté de ne pas autoriser/ recommander les fichiers NeTEx non compressés (vu qu'ils sont quand même souvent volumineux, et que la compression est très efficace sur ce format).

Je n'imposerais pas non plus de nom précis sur les fichiers eux mêmes, car ça va être parfois difficile à implémenter dans certains systèmes de génération.

prhod commented 3 weeks ago

+1 pour éviter les ZIP de ZIPs je propose de demander à ce que ça soit dans un ZIP, même s'il n'est pas compressé (même si ce serait mieux). ça permet d'harmoniser les méthodes de lectures

prhod commented 3 weeks ago

Précision évoquée en atelier GT7 :

TuThoThai commented 2 weeks ago

CR des discussions et décisions actés le 31 octobre 2024 :

Discussions

Nom de l’archive

Relevé de décision

Suite aux échanges le groupe formule les propositions suivante

TuThoThai commented 1 week ago

CR des discussions et décisions actés le 31 octobre 2024 :

Discussions

Nom de l’archive

* sujet non évoqué directement mais “héritant” des recommandations formulées.

* position évoquée par un participant mais non statué : ne pas imposer le nom

Nom des fichiers

* Les noms de fichiers doivent être uniques sans sémantique obligatoire au delà de “ligne_”

* Le producteur est libre de compléter et de générer un nom par regroupement pour assurer l’unicité

* Les autres recommandations sont :
  -- pas de majuscule
  -- le séparateur est “_”
  -- pas d’accent
  -- pas d'espace

Sous archives

* Pas de sous-archive autorisée

Relevé de décision

Suite aux échanges le groupe formule les propositions suivante

* les fichiers binaires, exécutables et sous archives sont interdites

* les autres fichiers type texte, json peuvent figurer dans l’archive mais seront ignorés à l’import

* des mesures de sécurités “propres à chaque consommateur” pourront conduire à des exigences complémentaires : il n’est pas du ressort du groupe de spécifier les contraintes afférentes.
  Ces règles pourront évoluer en fonction des contraintes et des situations rencontrées.

Lors de la réunion du 14 novembre 2024 : pas d'objection ➡️ à faire confirmer en plénière du GT7 du 21 novembre 2024

TuThoThai commented 5 days ago

validé en plénière en date du 21 novembre 2024 documentation à préparer