etalab / ban-data

Projet de suivi des données BAN et des scripts de traitements associés
20 stars 5 forks source link

Adresses sans libellé: nom_voie + nom_ld + alias à vide #36

Open cquest opened 9 years ago

cquest commented 9 years ago

Il y en a plus de 65000 sur la livraison d'avril 2015.

Plus de 53000 possèdent un id_fantoir, 12000 n'en ont pas.

Voir par exemple https://github.com/etalab/addok/issues/61

FrancoisVIGN commented 9 years ago

peut on nous fournir une liste de Cleabs "ADRNIVX" ?

cquest commented 9 years ago

J'avais fournit un dump complet des anomalies à Véronique sur la première livraison. Ceux-ci sont désormais dans "out": https://github.com/etalab/ban-data/commit/1dd7dc6e160f8c7483af8c06634857295331d1e5

Attention, les fichiers décompressés sont volumineux (plus de 1Go). Ils comportent le code insee de la commune, l'ID (cleabs), le champ incriminé, sa valeur, l'anomalie détectée.

Pour extraire seulement les adresses sans nom_voie ou nom_ld:

zcat anomalies_xxxx.csv.gz | grep "nom_voie et nom_ld vide"

yohanboniface commented 9 years ago

Je pense que https://github.com/etalab/ban-data/issues/55 soulève le même problème. Pas moyen de limiter les dégâts en posttraitement en attendant une correction à la source, @cquest ?

cquest commented 9 years ago

La sortie json destinée au géocodeur filtre désormais ces adresses sans nom de voie ou de lieu-dit. https://github.com/etalab/ban-data/commit/c4c12a1a727a2998280c5000eb7e962974d9b54d

cquest commented 7 years ago

178411 sur la livraison du 22/1/2017 dont 53427 avec un id_fantoir :(

odorie commented 7 years ago

La chaine de livraison IGN vient d'être améliorée pour compléter certains de ces noms vides