transition-bibliographique / poc-fne

Preuve de concept basée sur Wikibase pour le "Fichier National d'Entités" (Abes/BNF). Projet réalisé en 2019.
http://www.abes.fr/Autorites-et-referentiels/Projet-FNE-Fichier-National-d-Entites
4 stars 1 forks source link

Alignement des jeux de données BnF et ABES #222

Closed gotnc closed 4 years ago

gotnc commented 5 years ago

L'objet de ce ticket est d'utiliser WB ou ses extensions pour proposer un rapport d'alignement entre les entités des deux échantillons Abes et BnF chargés. L'objet de cet alignement peut être le dédoublonnage ou la fusion d'entités (voir #221). Les critères d'alignement, par type d'entité, sont les suivants (utilisation des propriétés pivot)

Pour les entités Personne :

Pour les entités Oeuvres :

Pour les entités Collectivités :

Le ticket est clos quand l'alignement a été effectué. Note : le nombre d'entités présentes dans les deux jeux de données est connu, ici il est attendu que la problématique soit abordée dans le contexte de WB et que l'on puisse avoir des pistes sur ce qu'il est possible de faire pour traiter nos données post chargement.

jum-s commented 4 years ago

Rapports d'alignement via le Query Service

A noter : Lorsque l'alignement des personnes s'effectue uniquement sur les ISNI 323 résultats sont trouvés contre 207 avec la requête ci-dessus (nom prénom et dates de naissance/décès)

Afin de répondre au besoin "le nombre d'entités présentes dans les deux jeux de données est connu", faut-il créer une autre requete SPARQL pour comptabiliser les résultats de chaque jeux de données ou bien le décompte "207 results in 244 ms" est-il suffisant ?

gotnc commented 4 years ago

Merci, je pense que c'est ok comme ça, à confirmer bien sûr par @AnilAng et @benbober