etalab / transport-qualite-des-donnees

2 stars 4 forks source link

[Réseau interurbain TIG] Fichiers contenus dans sous-répertoire + __MACOSX #11

Open thbar opened 1 year ago

thbar commented 1 year ago

Dans: https://transport.data.gouv.fr/resources/80675, on voit plusieurs problèmes.

Fichiers contenus dans un sous-répertoire

Les fichiers sont contenus dans un sous-répertoire TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39, ce qui n'est pas pratique pour les processus automatisés. Il faut placer les fichiers à la racine directement:

Cliquez ici pour le détail ``` ❯ curl -OL https://www.data.gouv.fr/fr/datasets/r/c4d5b965-b11c-4ed0-b437-1f412cf7a19b % Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 100 441 100 441 0 0 1595 0 --:--:-- --:--:-- --:--:-- 1664 100 33108 100 33108 0 0 56652 0 --:--:-- --:--:-- --:--:-- 56652 ~/Downloads/data ❯ ls -la total 88 drwxr-xr-x 4 thbar staff 128 May 15 09:37 . drwx------@ 181 thbar staff 5792 May 15 09:29 .. -rw-r--r--@ 1 thbar staff 6148 May 15 09:35 .DS_Store -rw-r--r-- 1 thbar staff 33108 May 15 09:37 c4d5b965-b11c-4ed0-b437-1f412cf7a19b ~/Downloads/data ❯ unzip -l c4d5b965-b11c-4ed0-b437-1f412cf7a19b Archive: c4d5b965-b11c-4ed0-b437-1f412cf7a19b Length Date Time Name --------- ---------- ----- ---- 0 02-27-2023 19:01 TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/ 270 02-27-2023 19:01 __MACOSX/._TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39 126 02-27-2023 23:01 TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/agency.txt 270 02-27-2023 23:01 __MACOSX/TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/._agency.txt 27198 02-27-2023 23:01 TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/calendar_dates.txt 270 02-27-2023 23:01 __MACOSX/TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/._calendar_dates.txt 66923 02-27-2023 23:01 TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/stop_times.txt 270 02-27-2023 23:01 __MACOSX/TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/._stop_times.txt 55657 02-27-2023 23:01 TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/shapes.txt 270 02-27-2023 23:01 __MACOSX/TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/._shapes.txt 7417 02-27-2023 23:01 TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/trips.txt 269 02-27-2023 23:01 __MACOSX/TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/._trips.txt 3690 02-27-2023 23:01 TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/trips_extensions.txt 270 02-27-2023 23:01 __MACOSX/TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/._trips_extensions.txt 9811 02-27-2023 23:01 TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/stops.txt 269 02-27-2023 23:01 __MACOSX/TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/._stops.txt 268 02-27-2023 23:01 TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/calendar.txt 270 02-27-2023 23:01 __MACOSX/TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/._calendar.txt 250 02-27-2023 23:01 TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/routes.txt 269 02-27-2023 23:01 __MACOSX/TIG_V15-du-27-02-2023_gtfs_2023-02-27_15-01-39/._routes.txt --------- ------- 174037 20 files ```

On voit aussi qu'il y a un répertoire en trop __MACOSX avec des fichiers qui ne sont pas dans la spécification, à retirer.

Par ailleurs sur le dataset https://transport.data.gouv.fr/datasets/reseau-interurbain-tig, les nouvelles versions de ressources sont ajoutées au lieu de remplacer les précédentes, ce qui n'est pas recommandé (les processus automatisés vont avoir tendance à les considérer comme des fichiers différents et les intégrer tous).