Closed rmelisson closed 3 years ago
grouper les résultats en fonction de la CC (pour éviter 50 résultats avec un nom similaire et la même CC)
ordonner les résultats par effectif
utiliser l'api annuaire (postgresql basé sur la donnée sirene) : https://github.com/etalab/api-annuaire-entreprises/
Option retenue , prototype avec :
Check cas particuliers / examples :
Retours test requête "Michelin Clermont-ferrand" Je tape Michelin j'ai toute une liste et je vois que l'entreprise que je cherche est là j'ai voulu rajouter Clermont-ferrand pour être plus précise dans ma recherche et j'ai perdu mes résultats.
C'est pas du tout géant de n'avoir que la ville et le code postal pour la recherche par nom d'entreprise c'est même logique vu qu'on demande que ça.
C'est plus perturbant pour la recherche par adresse postale car du coup on se retrouve avec tout et on voit pas le détail de l'adresse. il faudrait peut être rajouter l'adresse en entière pour le cas de recherche par adresse postale
Autre point sur la recherche par adresse pour l'adresse suivante "16 RUE DES HALLES 75001 PARIS 1" => je cherche le siret 81225808500016 (mon restaurant Gemini)
quand je mets l'adresse exacte présente sur mon annuaire-entreprise. Cesar (raison sociale de l'entreprise, enseigne Gemini) ne ressort pas. Il est en 12ème position...
je comprends dès que j'essaye la requête "airfrance" j'ai service indisponible alors que j'en essaye d'autres ça fonctionne mais dès que je reviens à airfrance ça ne fonctionne plus
ça fonctionne avec Air France ou avec le tiret 42049517800014
2 soucis avec la recherche "banque de France" =>
en tapant banque de France je ne trouve pas alors que c'est bien son nom...
avec le siret j'ai une convention collective bizarre siret "57210489100013" (j'ai vérifié sur annuaire entreprise ils mettent secteur activités bancaires
2 soucis avec la recherche "banque de France" =>
- en tapant banque de France je ne trouve pas alors que c'est bien son nom...
- avec le siret j'ai une convention collective bizarre siret "57210489100013" (j'ai vérifié sur annuaire entreprise ils mettent secteur activités bancaires
fait formidable je la retrouve par l'adresse également. bon par contre toujours pas la bonne cc
requête "mcdonald's"
je commence à taper la requête "mcdonal" et j'ai
dès que je rajoute le "d" à la fin ça refonctionne mais j'ai failli m'arrêter en me disant mince je dois me tromper sur l'orthographe
Je fais la requête "La poste" je n'ai pas de résultat du tout. L'entreprise existe bien sur annuaire-entreprise. Je tente avec le siret de celle rue des halles 35600000037187, je ne trouve pas non plus
Retours test requête "Michelin Clermont-ferrand" Je tape Michelin j'ai toute une liste et je vois que l'entreprise que je cherche est là j'ai voulu rajouter Clermont-ferrand pour être plus précise dans ma recherche et j'ai perdu mes résultats.
En fait le prob principal avec la ville en toutes lettres, c'est que beaucoup d'entreprises ont le nom de leur ville dans leur raison sociale, donc si tu cherches Michelin Clermont Ferrand
, les entreprises telles que "WESFORD CLERMONT FERRAND" matcheront mieux que "MANUF FRANC PNEUMATIQ MICHELIN" car pour la première clermont ferrand apparaît direct dans son titre.
2 options pour palier à ce problème :
Examples "populaire"
la poste 36
sncf 31
etam 26
adecco 24
super u 22
admr 21
auchan 20
intermarché 18
casino 16
millau 14
korian 13
leclerc 13
manpower 13
batiment etam 12
sodexo 12
afpa 11
ucanss 11
snaecso 11
elisfa 10
lidl 10
enedis 10
capgemini 10
fermatic 9
intermarche 9
leroy merlin 9
lamazuna 9
burger king 8
credit agricole 8
castorama 8
thales 8
hlm 7
airbus 7
yves rocher 7
banque populaire 7
gfi lyon 7
tilness 7
proman 7
croix rouge 7
Exemples 2/3 occurences :
4 croix rouge française
10 louis vuitton
18 mgen
26 dachser
30 orange
31 geodis
34 argedis
52 dassault
65 dba
68 sontag
74 prosegur
79 febus optics
104 france chimie
105 elior service
106 engie
107 volvo
134 hilti
143 decathlon
158 mc donald
160 groupama
162 chronopost
180 mettal
181 macdo
182 hyper u
Exemples uniques
0 picwictoys
1 cash systeme
2 igesa
8 staub fonderie
10 ccpaaf
11 declercq de
12 plasturie
14 papyra
15 safran electronics
24 armor isolation
26 mac donald's
27 le monde des crêpes
30 abc conduite
31 expertam
34 heuft france
36 kh-sk
37 continental circus
38 thyss
39 clinique les eaux claires
41 galeries lafayette avignon
44 kepler cheuvreux
49 cenexi
51 vinosaka
52 intradys-sas
53 electro energy caussade
54 sipaldis
57 antea archéologie
58 acpm marseille
63 villettaz
68 siarr
72 domicile clean
73 sitec
77 les p'tits jules au nid
82 presco
93 hypermarché carrefour
94 centre hospitalier prive sainte marie
95 isa developpement
102 dallmayr
103 groupe casino
104 peugeot sa
111 cadre métallurgie
114 acacia peinture
115 r.e.n.o.u.e.r association intermediaire
117 thyssenkrupp ascenseurs
127 l'ehpad saint joseph
135 ehpad le clos d'etrechy
136 sintax
139 humensis
142 chambre a air dualtron
143 hellow
144 rgi
147 sogranlotrans
149 ocp repartition
151 nationale de l'animation
158 sfr
159 smi ia
160 guillerm
165 advf
166 immo clean performance
169 debory
174 carestia
175 after eight
177 inter mutuelles assis
179 xpo log
180 mairie suresnes
181 pari mutuel urbain
183 centrica
184 clinique vétérinaire chauvy - pinelli -savelli
188 s.l expertise
190 uimm yonne
191 travaux paysagistes
193 crédit du nord grandvilliers
194 toshiba centre est
195 mairie d'aubervilliers
196 fpspp
198 lavida
201 industries céramiques
202 eht
203 innerspace
204 ucans
205 we'am
212 sarl enrico
214 multinet
216 avipur
217 acsso
218 roger marteau
219 simc ma
220 sécurité privee
221 mali's paysagiste jardinier
226 crédit mutuel nord
Divers interessant :
le 107
u express
sas fritschy morand
eurl baeza
guillet tp
arcanyst
u.p.i rené cassin
marrel
côté corp
auchan arras
sarl pestourie
Oups la recherche par adresse postale ne semble plus fonctionner. Pour info, j'ai essayé plusieurs adresses :)
j'ai du mal à comprendre la recherche "AFPA 33200", je cherche ce siret 82409268800210. J'ai que l'AFPAR qui fonctionne.
J'ai essayé avec le siret et rien non plus pourtant il est bien dans mon annuaire entreprise : https://annuaire-entreprises.data.gouv.fr/etablissement/82409268800210
Les autres AFPA n'ont pas de convention collective ?
exemple SMECSO siret 350 054 094 00064
Je tape Smecso et ca ne fonctionne pas.
Pas forcément surprenant étant donné que le nom de l'entreprise est SOCIETE DE MAINTENANCE ET D'EXPLOITATION DE CHAUFFAGE DU SUD OUEST.
Mais ce qui me surprend c'est quand je le cherche sur annuaire-entreprise j'ai bien écris smecso dans le titre de la fiche de l'établissement ... dommage qu'on le récupère pas https://annuaire-entreprises.data.gouv.fr/etablissement/35005409400064
je ne trouve pas cet établissement pourtant présent dans l'annuaire entreprise 77698354600032. Il n'a pas de convention collective ? ou nous n'avons pas la convention collective ?
en réponse à tes exemples :
c'est bon pour SMECSO ! (et pour le champs sigle
en général...)
c'est bon pour SMECSO ! (et pour le champs
sigle
en général...)
YEEEEEAH trop heureuse :) aahhh
en réponse à tes exemples :
- AFPA 33200 : pas de convention collective (https://annuaire-entreprises.data.gouv.fr/justificatif/824092688)
- SMECSO : bien trouvé ! j'avais pas vu ce champs (sigle), je le rajoute à notre index
- pour ton dernier exemple, pareil pas de convention collective (https://annuaire-entreprises.data.gouv.fr/justificatif/776983546)
- je regarde pour le prob de la recherche par adresse
D'acc je m'en doutais. Du coup ca me fait poser une question... Quand on a l'entreprise mais pas de CC dans notre base ne serait-il pas plus opportun pour l'usager de lui dire que nous n'avons pas de CC attaché à son entreprise ? car il va peut etre s'acharner ou se dire que ca ne fonctionne pas alors que si mais nous n'avons rien
oui c'est possible, faudra juste voir si ça rajoute pas trop de brui
oui c'est possible, faudra juste voir si ça rajoute pas trop de brui
oui en effet...
Petit cas : je cherche le Orange de Tarbes
Je mets "Orange 65000". Super j'ai le résultat
Par contre ci dans ma précipitation ou si je veux suivre l'intitulé qui m'est présenté pour l'entreprise, j'écris juste après "Tarbes" je perds mon résultat...
J'ai une petite question pour la rechercher suivante : "GEODIS"
Je tape geodis et j'ai ca comme résultat
Je ne comprends pas pourquoi GEODIS GEODISFR GEODISTH GEODISHUB GEODISHBC MERLIN - 25000 BESANCON siret 37884236300038 (effectif entre 6 et 9 salariés cf. https://annuaire-entreprises.data.gouv.fr/entreprise/378842363) arrive avant GEODIS LOGISTICS ILE DE FRANCE siren 315062752 (effectif entre 250 à 499 salariés cf. https://annuaire-entreprises.data.gouv.fr/entreprise/315062752)
Autre petite question : Lorsqu'une entreprise a 2 CCs, comment tu choisis quelle CC afficher en premier ? (exemple febus optics)
Promis la dernière, j'ai tapé volvo et je me demandais si c'était normal ce ".," avant le nom
@rmelisson Exemple pour la recherche Lidl avec l'option 1 "recherche par entreprise Siret sans adresse". Est-ce volontaire qu'il y ait les entreprises sans convention collective ? Il me semblait que c'était l'option 2 "recherche par entreprise sans convention collective"
cf. mes résultats ici
Autre cas : pour la recherche via entreprise + ville J'ai mis pour nom de l'entreprise "Auchan" et dans ville "Paris" Pourquoi est ce que mon premier résultat n'est pas paris qui arrive en 2nd ?
Rémi Dans le moteur "Nom de votre entreprise ou numéro de SIRET" ça vient d'où la donnée "RAR 364" dans la recherche "Zara", j'ai essayé d'aller sur annuaire-entreprise trouver cette entreprise mais je n'ai pas trouvé
Autre petit point Rémi. Pour la recherche "Crédit agricole Pyrénées Gascogne". j'ai testé avec le moteur "entreprise & adresse" et j'ai les résultats des entreprises sans convention collective. Du coup, dans ce moteur il y a pas de filtre sur les entreprises uniquement avec convention collective ?
@rmelisson Rémi nous avons détecté un petit comportement qu'il faudrait améliorer pour la recherche avec SIRET
SIRET d'exemple : 385 026 075 00015 (entreprise LA ROTONDE MONTPARNASSE)
Catherine a fait un copier de ce SIRET dans le moteur et voilà le résultat obtenu
On ne retrouve pas l'entreprise alors qu'elle a une convention collective Par contre si on enlève les espaces, on a bien le bon résultat
Il faudrait que si la personne fait un copier coller avec des espaces les espaces ne soient pas pris en compte
@rmelisson je pense que pour cette tâche sur l'algo du moteur de CCs on peut clôturer ? La tâche ux prend le relais
Notre besoin dans le moteur de recherche est d'identifier un SIRET afin de sélectionner la convention collective associée.
Cette recherche est assez limitée pour le moment. Par exemple, si la raison sociale de l'entreprise est très différente du nom de l'enseigne, il n'y a pas de correspondance entre les deux désignations.
Il faudrait dans un premier temps:
Nous pouvons ensuite croiser ces différentes sources et indexer celles-ci dans un index Elastic, et permettre à l'utilisateur de chercher avec des mots clés hétérogènes.