etalab / rncs_worker_api_entreprise

API pour récupérer et mettre à disposition les données du Répertoire National du Commerce et des Société
https://entreprise.data.gouv.fr
MIT License
23 stars 13 forks source link

Etude des dossiers correctifs #83

Open brindu opened 5 years ago

brindu commented 5 years ago

Les stocks partiels

Lorsqu'une erreur est rencontrée à l'import des fichiers en base (suite au non respect du processus de diffusion des données par les greffes comme détaillé dans la documentation) l'INPI fait une demande de dossier correctif, complet et à importer en annule et remplace : les stocks partiels.

Cette issue fait suite à l'étude des premiers stocks partiels diffusés le 24/08/2018.

Des dossiers complets demandés en cas d'erreur

Nous rencontrons nous même tout ou partie de ces cas d'erreurs, il sont documentés ici.

Par exemple, le fichier suivant tc/flux/2018/01/08/3501/328/3501_328_20180106_130534_11_obs.csv (transmission 328 du greffe de Rennes 3501 à la date du 8 janvier 2018) fait référence à un dossier jusqu'ici inconnu chez ce greffe identifié par son numéro de gestion 2018B00037 et le numéro siren 828277871 ; nous avons donc des observations qui nous sont communiquées alors qu'aucune personne morale ou physique associée n'a jamais été diffusée et dont nous ne connaissons rien (cf #35)

L'INPI a confirmé qu'elle faisait une demande de dossier complet dans ce genre de cas. Nous devrions donc pouvoir retrouver le dossier (numero_gestion: 2018B00037, siren: 828277871) dans un stock partiel futur.

Etude du stock partiel du 24 août 2018

Reprenons l'exemple précédent : le dossier (numero_gestion: 2018B00037, siren: 828277871). Le dossier correctif n'est pas présent dans le stock partiel du 24/08/2018. D'ailleurs aucun dossier correctif n'a été fourni par le greffe 3501 à cette date. A ce jour, aucun dossier correctif n'a été fourni par le greffe de Rennes ; il existe donc des anomalies dont les dossiers complets correctifs ne sont pas encore transmis plus d'un an après avoir été demandés.

Au final, très peu de dossiers correctifs sont transmis en comparaison du nombre d'erreurs relevées. Prenons le cas des "observations orphelines" présentes dans les fichiers de mises à jour mais dont la PM ou PP n'a jamais été transmise : entre le 4 mai 2017 et le 24 août 2018 il y a plus de 3600 observations orphelines qui devraient avoir induit la demande de dossiers correctifs pour le greffe de Paris (7501). Pourtant, le greffe 7501 n'a transmis aucun dossier correctif dans le stock partiel du 24 août 2018, et aucun autre stock partiel n'a encore été mis à disposition. On approche bientôt des deux ans de délai, au moins, pour obtenir des dossiers correctifs.

En conclusion

Très peu de dossiers correctifs sont transmis en comparaison du nombre de dossiers demandés : quelques centaines mis à disposition dans le seul stock partiel disponible en bientôt deux ans pour plusieurs dizaines de milliers d'erreurs censées avoir entrainé une demande de correction (plus de 35 000 erreurs uniquement avec les "observations orphelines" relevées après import jusqu'en septembre 2018).