datagouv / cadastre

Scripts de préparation des données cadastrales diffusées par Etalab
69 stars 11 forks source link

Adresses manquantes sur le cadastre "version beta" #59

Closed aducos closed 2 years ago

aducos commented 6 years ago

Je suis entrain d'analyser les adresses en version "beta" qui ont été mises à disposition dans le site https://adresse.data.gouv.fr/data-next/adresses-cadastre/2018/

J'ai pris le fichier du département 75 du répertoire ndjson-full/

Et je remarque qu'il manque beaucoup d'adresses par rapport à ce que l'on peut voir sur le site cadastre.gouv.fr

Exemple sur la parcelle

ou en concaténé '75111000CM0052' il n'y a que 2 adresses dans le fichier: "56 VOIE COMMUNALE PGE DU BUREAU" "58 VOIE COMMUNALE PGE DU BUREAU" id "75111-1388-56" et "75111-1388-58"

Mais si on va chercher cette parcelle sur cadastre.gouv.fr, on voit sur la carte les numéros

54 56 58 et 60 passage du bureau ainsi que les 1 et 3 impasse du bureau

Il manque donc 4 numéros sur 6 alors qu'il me semble que la carte de cadastre.gouv.fr est basée sur la même source de données.

Ceci se reproduit pour beaucoup de parcelles.

Je n'ai pas encore analysé le fichier edigeo car je n'ai pas trop d'outils pour le faire. Il serait intéressant d'avoir un fichier avec les adresses que l'on voit dans cadastre.gouv.fr avec le numéro de parcelle derrière.

jdesboeufs commented 6 years ago

En fait les adresses qui sont présentes dans le plan cadastral ne sont associées à aucune voie. Il ne s'agit que de numéros seuls. C'est notre cerveau qui fait l'association avec la voie dessinée à côté.

Pour la production de ce fichier d'adresses (https://github.com/etalab/adresses-cadastre) nous partons des fichiers fonciers, afin d'avoir une association numéro <=> voie.

Dans votre cas, les 54 et 60 pourraient être recyclés comme faisant parti d'une séquence, mais c'est hélas plus compliqué en angle de rue, lorsqu'il y a des numéros qui concernent deux voies.

Bref l'algorithme est perfectible, mais il faut trouver des astuces qui marchent et qui ne produisent pas trop de faux positifs.

aducos commented 6 years ago

Ok je comprends mieux. Ces adresses existent aussi dans le fichier MAJIC qui n'est malheureusement pas en open data car nous en recevons une extraction et les adresses 54 60 et 1 IMPASSE DU BUREAU sont dans mon fichier, mais pas le 3 IMPASSE DU BUREAU. Ces infos sont présentes au niveau des lots.

Il semblerait que les numéros 54 et 60 soient dans le fichier BANO. Dont beaucoup d'adresses ont extrait les adresses de cadastre.gouv.fr (je ne sais pas si c'est le cas pour ces 2 là). Mais dans BANO il n'y a pas de lien à la parcelle.

J'avais aussi tenté de croiser les adresse de la BAN avec les parcelles il y a quelques années mais les positions d'adresses étaient trop peu précises dans beaucoup de cas et surtout il manquait l'information sur la précision des adresses pour le faire sans erreur. Je tombait souvent sur la parcelle d'à côté en analysant le résultat.

Le sujet est loin d'être simple.

jdesboeufs commented 6 years ago

Si 54 et 60 sont dans MAJIC, elles devraient être dans notre extraction. Je vais regarder.

jdesboeufs commented 6 years ago

Nous n'exploitons pas encore le fichier PDDL de MAJIC, ceci explique peut-être cela.

ThomasG77 commented 2 years ago

Plus d'actualité avec la BAN et les BAL