datagouv / cadastre

Scripts de préparation des données cadastrales diffusées par Etalab
68 stars 10 forks source link

données RAW niveau département #44

Closed manuamador closed 6 years ago

manuamador commented 6 years ago

Bonjour,

Je viens de faire un tour dans les données raw (niveau commune). Ce sont des données intéressantes. En l'état, elles sont parfaitement exploitables en concaténant les champs et en faisant des étiquettes. Python permet de faire pas mal de mise en forme assez facilement pour cela. Le problème est le suivant: on a un besoin pour plus de 2500 communes. Et derrière un proxy d'entreprise, il est très compliqué pour moi de récupérer toutes les communes. Pensez-vous faire ces jeux de données à l'échelle d'un département ?

Merci encore pour tous vos efforts.

jdesboeufs commented 6 years ago

On peut faire ça mais le restreindre au dernier millésime et au format GeoJSON.

jdesboeufs commented 6 years ago

Et sans garantie quant au modèle de données.

manuamador commented 6 years ago

Super !

jdesboeufs commented 6 years ago

Les données sont disponibles.

manuamador commented 6 years ago

A propos des noms de voirie et des rivières, avec un peu d’algo et de regex on arrive à corriger une bonne partie des problèmes... Je peux partager les fonctions en python si vous le souhaitez. On doit corriger 90% des problèmes. Les efforts pour gagner un peu plus semblent assez lourds. Il faudrait passer par le fantoir. Mais c’est assez penible à faire.

jdesboeufs commented 6 years ago

Je suis preneur du code Python ! Et oui c’est pénible, mais j’ai déjà fait l’essentiel sur https://github.com/etalab/adresses-cadastre (WIP).

manuamador commented 6 years ago

Voilà, c'est moche, mais ça corrige un certain nombre de problèmes et cela rend le contenu "acceptable". https://gist.github.com/manuamador/675200e0b7a474dd156a5a25ad95a2db