etalab / rncs_worker_api_entreprise

API pour récupérer et mettre à disposition les données du Répertoire National du Commerce et des Société
https://entreprise.data.gouv.fr
MIT License
23 stars 13 forks source link

[TITMC] Établissement 'PRI' non-unique #68

Open Haelle opened 5 years ago

Haelle commented 5 years ago

Pour de nombreuses entreprise il n'y a pas qu'un seul établissement 'PRI'.

Comment identifier ces deux cas sans doutes ?

Exemples

1. Établissement SEC doublonné en établissement PRI

Dans le fichier 2018/05/05/6851_S1_20180505_lot01.zip::6851_S1_20180505_lot01.xml SIREN : 798998688 Deux établissements 'PRI' : 79899868800021, 79899868800013 Un établissement SEC : 79899868800021 L'établissement 79899868800021 est doublonné en SEC et PRI. On peut donc ici en déduire que 79899868800013 est le vrai établissement principal.

Cela semble concerner 1183 entreprises pour un total de 2533 établissements.

Est-il possible d'avoir de nouveaux dossiers corrigés ?

2. Deux établissements PRI avec des SIRETs différents

Dans le fichier 2018/05/05/9742_S1_20180505_lot01.zip::9742_S1_20180505_lot01.xml SIREN : 753657212 SIRETs 'PRI' : 75365721200019, 75365721200027 Ces deux établissements sont ouverts, donc ça ne peut être un "remplacement" dans l'ancien établissement PRI. Selon le site d'Infogreffe : 75365721200019 est le siège social 75365721200027 est l'établissement principal

Comment pouvons-nous déduire cela des données ?

3. Deux établissements PRI dans deux greffes différents

SIREN : 326367315 SIRET PRI chez 6851 : 32636731500024 SIRET PRI chez 6752 : 32636731500057 Selon Infogreffe ces deux établissement sont LE siège... Selon l'INSEE 32636731500057 est LE siège.

Autre exemple: SIREN : 319500427 SIREN PRI chez 9712 : 31950042700012 SIREN PRI chez 9711 : 31950042700020 Selon Infogreffe ce sont deux entreprises différentes, immatriculée à Basse Terre et Pointe-à-Pitre. Selon l'INSEE ces deux établissements sont bien ouverts, et 31950042700020 y est définit comme LE siège.

Haelle commented 5 years ago

Requête pour obtenir les SIREN qui possèdent plusieurs établissements principaux dans plusieurs greffes (sans les SIRENs qui ont plusieurs PRI dans le même greffe) :

select etA.siren
from (
  select ee1.siren
  from titmc_etablissements et1
  inner join titmc_entreprises ee1 on ee1.id::text = et1.entreprise_id
  where type_etablissement = 'PRI'
  group by ee1.siren
  having count(*) > 1
  ) etA
left join (
  select ee2.siren
  from titmc_etablissements et2
  inner join titmc_entreprises ee2 on ee2.id::text = et2.entreprise_id
  where type_etablissement = 'PRI'
  group by et2.entreprise_id, ee2.siren
  having count(*) > 1
  ) etB on etB.siren = etA.siren
where etB.siren is null;