transition-bibliographique / poc-fne

Preuve de concept basée sur Wikibase pour le "Fichier National d'Entités" (Abes/BNF). Projet réalisé en 2019.
http://www.abes.fr/Autorites-et-referentiels/Projet-FNE-Fichier-National-d-Entites
4 stars 1 forks source link

Fonctionnalités d'alignement, dédoublonnage, fusion d'entités #220

Open gotnc opened 5 years ago

gotnc commented 5 years ago

Ce ticket permet de synthétiser en un seul ticket la spécification de l’ensemble des fonctionnalités ayant trait à l’alignement, au dédoublonnage, et à la fusion d’entités. En amont du rapport final qui devra donner un avis spécifique sur chacune de ces fonctionnalités, l’objet du présent ticket est de fournir des orientations de plus haut niveau sur ce qu’il conviendrait de faire pour répondre aux besoins spécifiques du POC sur cette question.

L’avis portera sur les points suivants :

Le ticket est considéré clos lorsque les tickets #221, #222 (et #202) ont été eux-mêmes clos et que les éléments de réponse ont été amenés en commentaire.

gotnc commented 4 years ago

Je partage ici quelques liens qui m'ont permis d'appréhender la questions sous plusieurs angles :

https://www.wikidata.org/wiki/Help:Merge : récap de plusieurs outils qui permettent d'identifier des doublons et de fusionner quand nécessaire Voir notamment : https://www.wikidata.org/wiki/Help:QuickStatements#Item_merging (avec quick statements donc) et la fonctionnalité qui permet de marquer comme doublon https://www.wikidata.org/wiki/User:Mat%C4%9Bj_Such%C3%A1nek/markasduplicate.js

Ce qui est intéressant aussi : le fait que certains rapports (database reports) sont en partie créés sur des dumps de wikidata (à l'extérieur donc de wikibase) https://www.wikidata.org/wiki/Category:Merge_candidates https://www.wikidata.org/wiki/Wikidata:Database_reports

benbober commented 4 years ago

Scénario de fusion:

Observations :

benbober commented 4 years ago

Problème lors de l'annulation de la fusion:

benbober commented 4 years ago

Complément au problème: j'ai créé deux entités autres entités Q210418 et Q210419, en émettant l'hypothèse que l'ordre dans lequel se fait les restaurations (cible puis source ou source puis cible) avait une incidence, mais non, tout marche bien cette fois-ci. Je me replonge dans ce que j'ai fait pas à pas pour l'exemple précédent

jum-s commented 4 years ago

la documentation explicite le comportement. L'ordre des actions est important, mais sur des entités qui n'ont pas de sitelinks cela ne devrait pas poser problème.

jum-s commented 4 years ago

Voici un test pour restaurer l'état initial de deux entités fusionnées :

Prérequis :

Déroulement :

maxlath commented 4 years ago

Sur les différences de comportements entre la page Special:MergeItems et l'API wbmergeitems, on peut se référer à leur code source respectif :