BaseAdresseNationale / addok-docker

Conteneurs Addok pour Docker
151 stars 28 forks source link

Erreur d'encodage sur certaines adresses #28

Closed Abdel0U closed 2 years ago

Abdel0U commented 2 years ago

Bonjour,

Nous avons constaté en faisant quelques tests (après avoir installé l'instance addok sur un environnement linux), que sur certaines adresses le caractères "\ufffd" est renvoyé dans l'adresse et on arrive pas à correctement l'interpréter.

Exemple: Appel: http://SERVER/search?q=18%20rue%20he&autocomplete=0&limit=20

Réponse:{
   "type": "FeatureCollection",
   "version": "draft",
   "features":    [
          ............,
          ...........,
            {
         "type": "Feature",
         "geometry":          {
            "type": "Point",
            "coordinates":             [
               5.879955,
               48.291498
            ]
         },
         "properties":          {
            "label": "**18 Rue Brûl��e 88170 La Neuveville-sous-Châtenois**",
            "score": 0.4447504195804196,
            "housenumber": "18",
            "id": "88324_3t7sdh_00018",
            "name": "18 Rue Brûl��e",
            "postcode": "88170",
            "citycode": "88324",
            "x": 913556.98,
            "y": 6802913.6,
            "city": "La Neuveville-sous-Châtenois",
            "context": "88, Vosges, Grand Est",
            "type": "housenumber",
            "importance": 0.27687,
            "street": "Rue Brûl��e"
         }
      },
            {
         "type": "Feature",
         "geometry":          {
            "type": "Point",
            "coordinates":             [
               -1.024891,
               43.80444
            ]
         },.............

Et pour info, on a le même résultat en utilisant l'url "https://api-adresse.data.gouv.fr/search?q=18%20rue%20he&autocomplete=0&limit=20".

Est ce que vous avez une idée sur la source de ce caractère et comment le corriger?

Merci beaucoup pour votre aide.

yohanboniface commented 2 years ago

Apparemment il est dans les fichiers source:

$ ag 88324_3t7sdh_00018 adresses*                                                                                                                                     225ms
adresses-88.csv
81752:88324_3t7sdh_00018;;18;;Rue Brûl��e;88170;88324;La Neuveville-sous-Châtenois;;;913556.98;6802913.6;5.879955;48.291498;;;;LA NEUVEVILLE-SS-CHATENOIS;RUE BRUL E;inconnue;inconnue;0

adresses-addok-88.ndjson
7057:{"id":"88324_3t7sdh","name":"Rue Brûl��e","postcode":"88170","citycode":["88324"],"oldcitycode":null,"lon":5.879955,"lat":48.291498,"x":913556.98,"y":6802913.6,"city":["La Neuveville-sous-Châtenois"],"oldcity":null,"context":"88, Vosges, Grand Est","type":"street","importance":0.27687,"housenumbers":{"18":{"id":"88324_3t7sdh_00018","x":913556.98,"y":6802913.6,"lon":5.879955,"lat":48.291498}}}

@cquest @jdesboeufs quelqu'un pour remonter la source ? :)

jdesboeufs commented 2 years ago

Oui c'était bien les fichiers sources. C'est corrigé. Cela provenait d'un bug dans papaparse :) Cf https://github.com/mholt/PapaParse/issues/908

Abdel0U commented 2 years ago

Merci pour votre retour et votre réactivité. Dernière question, la correction prendra effet sur la nouvelle version de la base d'adresse, est ce bien cela? Encore merci !!!