mobility-team / mobility

Mobility, an open-source library for mobility modelisation
MIT License
16 stars 11 forks source link

Exemple Millau - Comparaison données INSEE #18

Open AntoineGauchot opened 2 years ago

AntoineGauchot commented 2 years ago

Calcul de la mobilité domicile-travail avec le modèle d'opportunités et comparaison avec les données de l'INSEE

Le dossier examples/Millau utilise le modèle d'opportunités pour déterminer les flux domicile-travail, à partir de la répartition des actifs et des bassins d'emploi sur le territoire autour de Millau et les compare aux données mesurées par l'INSEE en 2017 (fluxDtMillau2017.xlsx dans le dossier).

1/ Le modèle d'opportunité

Données d'entrée : La base emploi et population active par commune de 2018 (chargée par get_insee_data) est utilisée pour obtenir une quantité de demande (ici les actifs) par commune et une quantité d'opportunités (ici les emplois) par commune. Le coût utilisé est la distance vol d'oiseau entre le centroïde de la commune de départ et celui de la commune de destination. Pour les flux intra-communes, le coût utilisé est la distance moyenne entre deux points aléatoires d'un cercle 128R/(45pi) où R est le rayon de la commune si l'on la modélise par un disque (R = sqrt(surface commune)/pi)

Périmètre : Le périmètre choisi doit dans l'idéal contenir l'ensemble des lieux de travail possibles pour un habitant de Millau. Nous verrons par la suite que le choix de ce périmètre a une grosse influence sur les résultats. Deux périmètres sont testés :

  1. L'Aveyron, la Lozère, l'Hérault, le Gard et le Tarn : 1,13M d'actifs // 0,95M d'emplois
  2. L'Aveyron et la Lozère : 155K d'actifs // 143K emplois

Répartition des actifs sur le 1er périmètre image

Résultats : Le flux total calculé sur le 1er périmètre est 0,95M déplacements DT (tous les emplois ont été pourvus). Celui sur le 2ème périmètre est 143K déplacements DT (tous les emplois ont été pourvus) Représentation graphique des flux DT calculées par le modèle (plus un point est gros, plus la mobilité intra-communale de cette commune est élevée) 1er périmètre image

2ème périmètre image

2/ Comparaison avec les données INSEE

On effectue la comparaison uniquement sur les OD en commun entre les flux générés par le modèle et les flux mesurés par l'INSEE :

  1. Sur le 1er périmètre, 355 OD en commun. Sur ces 355 OD : Flux total mesurée par l'INSEE : 15 214 (dont 48% de flux intra-communal) Flux total du modèle : 13 201 (dont 45% de flux intra-communal) Flux commun (entre le modèle et l'INSEE) : 10 144 (soit 67% du flux INSEE) Le modèle sous-estime le flux total de 13% et sous-estime légèrement la part du flux intra-communal. Si on regarde uniquement la répartition entre les OD (on divise la quantité de flux pour chaque OD par la quantité de flux total) pour gommer la différence dû à la sous-estimation du flux total : La répartition mesurée par l'INSEE et celle générée par le modèle ont 75% en commun.

    Représentation graphique du flux INSEE sur les OD en commun image

    Représentation graphique du flux calculée par le modèle sur les OD en commun image

    Au vu des représentations graphiques, il semble que le modèle favorise trop les OD lointaines (les Millau-Rodez, Millau-Montpellier) au détriment des flux périurbain/banlieue -> ville centre et périurbain/banlieue->périurbain/banlieue

  2. Sur le 2ème périmètre, 301 OD en commun. Sur ces 301 OD : Flux total mesurée par l'INSEE : 14 907 (dont 49% de flux intra-communal) Flux total du modèle : 13 424 (dont 46% de flux intra-communal) Flux commun (entre le modèle et l'INSEE) : 10 603 (soit 71% du flux INSEE) Le flux du modèle a augmenté de 4% p/r au 1er périmètre (l'importance relative de Millau dans ce périmètre restreint a augmenté). La répartition mesurée par l'INSEE et celle générée par le modèle ont 77% en commun.

3/ Autres tests

Il a aussi été testé de calculer les flux DT avec le modèle en distinguant selon la CSP. On distingue le nombre d'emploi et d'actifs par commune selon la CSP : un personne avec une certaine CSP choisira sa destination selon la répartition des emplois ayant cette même CSP. L'impact sur les résultats de cette méthode a été très faible.

D'autres valeurs de alpha et beta que alpha=0 et beta=1 ont été testées. Toutes se sont révélées moins pertinentes que le couple alpha, beta = (0,1) choisi initialement. Pour rappel, alpha représenterait le comportement exploratoire de l'individu (favorise les destinations lointaines avec beaucoup d'opportunités) et beta le comportement prudent (favorise les destinations les plus proches qui ont plus d'opportunités que les destinations intermédiaires).

Il a été testé une autre distance interne, en considérant la surface urbanisée de la commune (plus restreinte que la surface de la commune). La part du flux intra-communale a très légèrement augmenté (+1%).

4/ Conclusion

Le modèle a su prédire en partie la mobilité domicile-travail sur le territoire de Millau, même si le volume total a été sous-estimé. Ces résultats montrent aussi l'importance du périmètre que l'on donne au modèle, les résultats s'étant légèrement améliorés en considérant un territoire plus restreint.

FlxPo commented 2 years ago

Super test, bravo !

Je pense que les résultats pourraient être améliorés en prenant en compte la distance réellement parcourue et le temps de transport : on voit bien le flux Millau - Nimes qui est surestimé, sûrement parce que la distance à vol d'oiseau est beaucoup plus faible que la distance réelle du trajet qui passe sûrement par Montpellier. Mais je propose de consolider déjà ce que nous avons avant de développer ce sujet.

Comment as tu mesuré la qualité de l'estimation des volumes des flux ? J'avais utilisé le "sorensen similarity index" (SSI) défini dans l'article sur le modèle de radiation de Liu et Yan :

image

Ceci étant dit il faut bien voir que les données de flux INSEE sont aussi issues d'un modèle puisqu'ils redressent les données du recensement. La documentation dit : "De façon générale, compte tenu notamment du sondage, les flux faibles (moins de 200) devront être considérés comme des ordres de grandeur." (https://www.insee.fr/fr/information/2383337)

Donc le SSI sera surtout pertinent pour des flux > 200 personnes.

Mind-the-Cap commented 1 year ago

L'implémentation du SSI et l'amélioration du code sont dans la PR: https://github.com/mobility-team/mobility/pull/21 Le test est maintenant faisable sur tous ensemble de départements !

Mind-the-Cap commented 1 year ago

J'ai également commencé un billet de blog sur le sujet : https://github.com/mobility-team/mobility-team.github.io/pull/50

Mind-the-Cap commented 1 year ago

To-do list: