Closed manuamador closed 6 years ago
On peut faire ça mais le restreindre au dernier millésime et au format GeoJSON.
Et sans garantie quant au modèle de données.
Super !
Les données sont disponibles.
A propos des noms de voirie et des rivières, avec un peu d’algo et de regex on arrive à corriger une bonne partie des problèmes... Je peux partager les fonctions en python si vous le souhaitez. On doit corriger 90% des problèmes. Les efforts pour gagner un peu plus semblent assez lourds. Il faudrait passer par le fantoir. Mais c’est assez penible à faire.
Je suis preneur du code Python ! Et oui c’est pénible, mais j’ai déjà fait l’essentiel sur https://github.com/etalab/adresses-cadastre (WIP).
Voilà, c'est moche, mais ça corrige un certain nombre de problèmes et cela rend le contenu "acceptable". https://gist.github.com/manuamador/675200e0b7a474dd156a5a25ad95a2db
Bonjour,
Je viens de faire un tour dans les données raw (niveau commune). Ce sont des données intéressantes. En l'état, elles sont parfaitement exploitables en concaténant les champs et en faisant des étiquettes. Python permet de faire pas mal de mise en forme assez facilement pour cela. Le problème est le suivant: on a un besoin pour plus de 2500 communes. Et derrière un proxy d'entreprise, il est très compliqué pour moi de récupérer toutes les communes. Pensez-vous faire ces jeux de données à l'échelle d'un département ?
Merci encore pour tous vos efforts.