Closed gotnc closed 4 years ago
J'ai effectué un chargement en local, ça donne ceci :
Résumé :
Comme vu ensemble, le nombre d'éléments d'origine ABES inférieur aux nombres de notices ABES est dû à la fusion de notices analysées à tord comme étant des doublons (on peut notamment voir les opérations d'enrichissement (enriched
) d'éléments existant dans les logs, exemple)
Mesures de temps :
extract : 2,727s
transform : 0,978s
load : 1183,117s (soit 19 minutes 43 secondes)
total : 1186,831s (soit 19 minutes 46 secondes)
soit 0,241s par entité créée (1187/(1286 + 2909 + 739)
)
ou 0,317s par notice analysée et chargée (1187/(2887+859)
)
Aucune parallélisation n'a été implémentée pour le chargement, les 8 cœurs du processeur renseignés ci-dessous sont donc largement sous-exploités.
Environement :
Une piste d'optimisation du temps de chargement serait de faire les opérations de fusion/enrichissement en amont (transform
) et donc de pouvoir paralléliser le chargement (load
) : au doigt mouillé, on devrait pouvoir charger au moins 5 à 10 fois plus vite
Le temps peut être estimé en regénérant le chargement en local sans toucher à la WB ABES. Il est attendu qu'avec les temps de chargement soient indiquées les détails de la configuration utilisée et que le tout soit explicité dans le rapport final.