transition-bibliographique / poc-fne

Preuve de concept basée sur Wikibase pour le "Fichier National d'Entités" (Abes/BNF). Projet réalisé en 2019.
http://www.abes.fr/Autorites-et-referentiels/Projet-FNE-Fichier-National-d-Entites
4 stars 1 forks source link

Créer l'adaptateur Unimarc=>Wikibase #203

Closed benbober closed 5 years ago

benbober commented 5 years ago

Objectif : Charger les notices ABES (dispos ici https://github.com/abes-esr/poc-fne/blob/master/ABES_echantillon_donnees_ALL.xml) dans wikibase en suivant le principe de la modélisation "naïve", à l'image de ce qui a été fait pour les notices de la BnF. Par ailleurs, les propriétés modélisées "en dur" et définies dans le fichier produit par la tâche #204 seront implémentées.

Ce qui est attendu:

Le ticket est clos quand l'échantillon de données ABES peut être consulté dans la Wikibase ABES selon les critères listés.

jum-s commented 5 years ago

Nous aurions besoin de deux notices de l'échantillon abes pour effectuer des tests de bases avant de pouvoir intégrer l'ensemble de l'échantillon. Idéalement une notice personne ou collectivité plutôt simple et une notice oeuvre avec une relation auteur-oeuvre incluse dans la notice (caractéristiques similaires au travail effectué sur intermarc). J'ai trouvé http://www.idref.fr/027273881 et http://www.idref.fr/026361000 qui sont dans l'échantillon. Nous allons commencer avec çà, mais si d'autres notices sont plus pertinentes, nous sommes ouverts à suggestion.

jum-s commented 5 years ago

Petite question qui évite des déductions métier: dans une notice unimarc, quelle information (dans le champ leader si possible) permet de savoir son type (collectivité, personne, titre etc) ?

benbober commented 5 years ago

Le type d'entité peut être trouvé dans deux endroits :

Entité leader, position 9 controlfield 008
Personnes a Tp
Collectivités b Tb
Lieux c Tg
Oeuvres f ou h Tu ou Tq

Dans le cadre du POC, le chiffre que l'on trouve en controlfield 008 n'a pas d'importance

benbober commented 5 years ago

Notice personne pas trop compliquée: 027059456 (Pasolini) oeuvre avec relation à un agent: 082349983 (Décaméron de Pasolini)

jum-s commented 5 years ago

parfait merci

maxlath commented 5 years ago

@benbober dans le fichier de modélisation des propriétés pivots en Unimarc, il est fait référence à des sous-champ pour des zones du controlfield ne semblant pas en disposer (ex: 008 $a), est-ce que ça ne devrait pas plutôt être des positions comme dans le fichier BNF ?

benbober commented 5 years ago

@maxlath merci, corrigé dans github. Le $a existe dans le MARC de production mais pas d'import, celui qu'on a utilisé pour l'échantillon. Pas d'autres problèmes de ce type, si ?

maxlath commented 5 years ago

@benbober quelques autres points :

Francois-Mistral commented 5 years ago
benbober commented 5 years ago

fichier de conf mis à jour sur la branche master