J'ai fait des choix semi-arbitraires pour éviter d'avoir trop de "domaines" (réflexion en cours de notre côté)
Au delà d'importer une nouvelle source, la base est maintenant nettoyée de plein de données en double (voir en quadruple) mal qualifiées. Je n'arrive pas à voir de faux positifs (faux doublons) dans mes tests donc ça semble beaucoup mieux qu'avant. Le script est ici et mérite d'être amélioré s'il continue à être utilisé : https://github.com/betagouv/eac-api/blob/master/scripts/post-fix-actors.js (il est cependant commenté et lisible)
Donc mon souhait @vinyll est que tu teste cette migration (avec quelque chose du genre : MONGO_URI=mongodb://localhost:27017/eac JOCONDE_ACTORS_FILE=/path/JMR_MUSEO_20180111.xlsx LOUP_ACTORS_FILE=/path/liste.csv npm run db-seed qui fait toutes les opérations) puis que tu confirme (ou infirme) dans ce ticket qu'on peut lancer la migration en prod.
Avant de lancer une nouvelle migration des données en PROD, je pense qu'il est nécessaire de valider par un test de ton côté @vinyll.
Quoi de neuf ?
Donc mon souhait @vinyll est que tu teste cette migration (avec quelque chose du genre :
MONGO_URI=mongodb://localhost:27017/eac JOCONDE_ACTORS_FILE=/path/JMR_MUSEO_20180111.xlsx LOUP_ACTORS_FILE=/path/liste.csv npm run db-seed
qui fait toutes les opérations) puis que tu confirme (ou infirme) dans ce ticket qu'on peut lancer la migration en prod.