etalab / transport-site

Rendre disponible, valoriser et améliorer les données transports
https://transport.data.gouv.fr
195 stars 30 forks source link

GBFSMetadata : retire les stations avec données irréalistes #4317

Closed AntoineAugusti closed 4 days ago

AntoineAugusti commented 6 days ago

Ignore les données des stations où le nombre de docks ou de véhicules disponibles dans une seule station semble irréaliste (plus de 500).

Ceci permet d'éviter d'avoir des statistiques incohérentes.

Ceci survient par exemple pour Lime Paris, voir Mattermost.

{
  "last_updated": 1731763709,
  "ttl": 0,
  "version": "2.2",
  "data": {
    "stations": [{
      "station_id": "paris",
      "num_bikes_available": 9669,
      "num_docks_available": 999999,
      "is_installed": true,
      "is_renting": true,
      "is_returning": true,
      "last_reported": 1731763709
    }]
  }
}
AntoineAugusti commented 4 days ago

cc @stephane-pignal, tu as un avis sur le chiffre de 500 ?

AntoineAugusti commented 4 days ago

C’est tout bon. Très élégant cette fonction unrealistic_station_data?/1, y’a des cas où le chaînage en Elixir donne des choses super lisibles.

Yes j'étais content de la lisibilité générale aussi ! J'ai bien fait attention à utiliser Enum.reject et nommer la méthode en conséquence.

Y’a rien à retirer de similaire dans d’autres feeds GBFS (le feed vehicles) ?

Et bien on verra si c'est le cas 😬 Dans le flux véhicules 1 enregistrement = 1 véhicule.