Closed martindaniel4 closed 7 years ago
Yo @samronsin ! t'as réussi à sortir quelque chose avec les données INSEE ?
I'm on it!
Il faut attribuer le code géographique INSEE CODGEO à chaque centre, ce qui permettra de récupérer toutes les données de la commune / département (chômage, population). J'ai pas regardé sur BQ, mais comme on ne l'a pas en agrégé, je doute qu'on l'ait en détail. Tu peux confirmer @martindaniel4 ?
@samronsin hmm t'as pas de latitude / longitude ?
Sinon pour transformer INSEE CODGEO, t'as checké ça ? https://github.com/anthill/open-moulinette/tree/master/insee-iris
On a latitude / longitude pour les centres?
@samronsin et oui cousin ! https://github.com/dataforgoodfr/croixrouge/blob/master/data/croixrouge/position_centres_2015_CRF.xlsx
Cool, merci!
Avec ça, on devrait y arriver... https://www.data.gouv.fr/fr/datasets/listes-des-communes-geolocalisees-par-regions-departements-circonscriptions-nd/
héhé
@dataforgoodfr/datagooders j'ai ajouté la liste des quartiers prioritaires définis dans par le Décret n° 2014-1750 du 30 décembre 2014.
Accessible là - https://github.com/dataforgoodfr/croixrouge/commit/3e238fff97c61e4654cc66be4a4405471b0b6da1
ola @samronsin je suis en train de faire la présentation de mardi.
J'aimerais notamment faire une carte avec plusieurs calques (taux de pauvreté, implantation des Unités de distribution, implantation des autres associations etc..) pour un endroit / quartier prioritaire. Je pense par exemple au 93 ou au Nord.
Si t'as des choses à m'envoyer hésite pas..
J'ai aussi ajouté les codes / lattitude INSEE ici - https://github.com/dataforgoodfr/croixrouge/commit/9a0e486e8015a27c1a2e1ece02e27e4bcdfb8979
@martindaniel4 @samronsin pour les quartiers prio, je les ai ajoutés jeudi avec leur coordonnées GPS (j'ai pris le centre des polygones): data/croixrouge/position_quartiers_prioritaires_2015.csv y'a aussi dans data/ la liste des centres banque alimentaire et restos du coeur. j'ai tenté de faire des carto avec, mais pas très lisible de manière brute : trop de points (surtout restos du coeur), je vais voir pour un zoom sur qqs departs, sinon faut faire un scoring de densité
@martindaniel4 @samronsin j'ai commité un notebook python : commit 0a104dc dans misc/overlay_... qui montre une carte avec quarties sensibles (cercles larges noirs transparents), CRF (rouge), restos du coeur (bleu), banque alimentaire (vert). dites moi si ça tourne chez vous (pas le courage de regarder ce soir comment en faire une carte à partager) j'ai centré sur les alentours de Valencienne, peu de CRF et bizarrement très peu de restos du coeur (à valider le scrapping + voir s'il n'y a pas une assoc locale) un peu au sud il y a un bled Le Quesnoy avec aucune assoc Sinon j'ai vu du côté de Lyon, La CRF est très présente... en plein centre, alors que les quartiers prio sont bien plus éloignés en périphérie le 93, plus difficile de trouver rapidement les points à améliorer: beaucoup de tout, sans doute il manque des points de distribution, mais faudra plus prendre en compte la densité de population je m'y remets demain soir.
@c-o cool les données quartiers prioritaires! pas pu ouvrir le notebook par contre: erreur "bad request"...
@c-o au temps pour moi, ipython n'était pas à jour chez moi, ça marche maintenant!
preview avec le taux de chômage
@samronsin très cool.
Comme on se le disait, on manque de data (vs le simple taux de chômage) pour avoir une bonne variation par commune.
On pourrait avoir :
yes, voici le nombre de chômeurs par commune (fin 2011), les variations sont beaucoup plus nettes! en fait ce qu'il faudrait estimer en proirité, c'est le nombre (absolu) de bénéficiaires potentiels à chaque point de la carte. on peut se dire que le nombre de demandeurs d'emploi est une approximation raisonnable (à un facteur près qui correspondrait à celui entre un actif et ceux qui dépendent de lui).
c'est le nombre (absolu) de bénéficiaires potentiels à chaque point de la carte
@samronsin on pourrait pas faire ça avec les données qu'on a de CRF sur les bénéficiaires ?
On a une table dans les données brutes, avec une ligne par donation par bénéficiaire..
si on prend des données par centre, et qu'on dit que ça correspond à ce qui se passe dans la commune qui héberge le centre, on fait implicitement l'hypothèse que les bénéficiaires d'un centre sont résidents de la commune qui l'héberge...
@lefko2000 a rajouté les volumes stock conso et restants par centres CRF pour tous les centres. Du coup on pourrait rendre variable la taille des rond CRF pour avoir une idée de la conso (en espérant trouver par ex un excédant haut de seine sud vs nord) de mon côté j'ai fait un maillage de toute la france avec une densité de quartier prio vs centres CRF a priori les points d'intérêts serait: manque de CRF:
Nord de Vienne
trop de CRF:
Je vais voir si je peux faire une carte avec ça
@c-o mortel !
@samronsin tu penses pouvoir intégrer ça dans ta map ? On peut régler la taille des bulles avec le paramètre size de mémoire
@dataforgoodfr/datagooders ca donne donc ça.
Le ratio # centres / chômeurs sont parlants je trouve. On pourrait étendre l'analyse à la France pour voir ce que ça donne :
ok version rectifiée :
top!
@samronsin t'as réussi à intégrer les données de @lefko2000 ? Je serais intéressé de voir ce que donne le volume / centre entre le 92 nord et le sud.
Yes, voici le flux localisé qui a bien l'air plus important au nord du 92 qu'au sud! Deux mises en garde:
@samronsin chanmé :)
Ca valide ce qu'on pensait non du coup ? Plus d'activité là où il y a plus de chômage ?
Oui plutôt! Après il faudrait vérifier qu'on a les bonnes données sur ce jeu et tâcher de séparer les coordonnées de centres qui seraient dans la même commune...
@samronsin yes, on va récupérer l'adresse exacte des U2A de la CRF. Ca aidera.
On va aussi avoir les données brutes de distribution par bénéficiaire de la base AIDA, on pourra avoir plus d'éléments à analyser..
@martindaniel4 super! Tiens, en passant, la carte des stocks (mêmes commentaires).
@samronsin très cool : )
@martindaniel4 en revanche difficile de dire quelque chose de clair à partir de la variable consoRate de @lefko2000 (à part que les stocks sont faibles dans quelques centres dans le 93 et le 91).
@samronsin @lefko2000 si elle est élevée, cela veut dire qu'on accumule plus que ce qu'on donne ?
(je m'emmêle les pinceaux à chaque fois)
yes (moi aussi). ici, le rayon représente la valeur absolue de consoRate et la couleur le signe: rouge si négatif, vert si positif (il y a peu de vert en région parisienne). rouge <=> distribution > stock
@c-o @samronsin @lefko2000 @RomainWarlop j'ai ajouté le fichier d'adresses U2A ici - https://github.com/dataforgoodfr/croixrouge/blob/master/data/croixrouge/adresse%20U2A.xlsx
On ne disposait jusque là que des centres Croix Rouge généralistes.
j'ajoute les coordonnées long/lat à partir des adresses précises des centres U2A. je regarde aussi pour rajouter le code geo INSEE pour pouvoir faire le lien entre AIDA et les données de INSEE pour faire le proxy
Cool @lefko2000 a choppé les données GPS à partir des adresses.
Cool pour le proxy, partage tes idées c est vraiment là qu on peut craquer quelque chose Le 2015-05-26 11:28 PM, "Benjamin Rey" notifications@github.com a écrit :
j'ajoute les coordonnées long/lat à partir des adresses précises des centres U2A. je regarde aussi pour rajouter le code geo INSEE pour pouvoir faire le lien entre AIDA et les données de INSEE pour faire le proxy
— Reply to this email directly or view it on GitHub https://github.com/dataforgoodfr/croixrouge/issues/18#issuecomment-105669937 .
@martindaniel4 @c-o cool pour les adresses et coordonnées! Je regarde de plus près + demande via variables INSEE début de semaine prochaine.
@samronsin t'as réussi à faire un premier essai ?