etalab / transport-qualite-des-donnees

2 stars 4 forks source link

[Réseau urbain Horizon] fichiers contenus dans un sous-répertoire #10

Open thbar opened 1 year ago

thbar commented 1 year ago

Dans https://transport.data.gouv.fr/resources/80550, les fichiers sont contenus dans un sous-répertoire GTFS 220822, ce qui n'est pas pratique pour les processus automatisés.

Il est préférable de supprimer ce sous-répertoire et de placer les fichiers à la racine du zip.

❯ curl -OL https://data.chateauroux-metropole.fr/api/datasets/1.0/reseau-de-bus-urbain_horizon/attachments/gtfs_220822_zip
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  155k  100  155k    0     0   469k      0 --:--:-- --:--:-- --:--:--  476k

~/Downloads/data 
❯ ls
gtfs_220822_zip

~/Downloads/data 
❯ unzip -l gtfs_220822_zip 
Archive:  gtfs_220822_zip
  Length      Date    Time    Name
---------  ---------- -----   ----
      198  08-22-2022 16:05   GTFS 220822/agency.txt
      700  08-22-2022 16:05   GTFS 220822/calendar.txt
     7582  08-22-2022 16:05   GTFS 220822/calendar_dates.txt
      188  08-22-2022 16:05   GTFS 220822/feed_info.txt
     1662  08-22-2022 16:43   GTFS 220822/routes.txt
  1765569  08-22-2022 16:27   GTFS 220822/stop_times.txt
    89672  08-22-2022 16:28   GTFS 220822/stops.txt
    76626  08-22-2022 16:05   GTFS 220822/trips.txt
---------                     -------
  1942197                     8 files

Par ailleurs le fichier est publié en double (https://transport.data.gouv.fr/datasets/reseau-de-bus-urbain-horizon) et les données sont apparemment exactement les mêmes:

❯ cksum GTFS*
3343148758 159521 GTFS 220822.zip.1
3343148758 159521 GTFS 220822.zip.2