OPUS4 / application

OPUS 4 application.
Other
15 stars 21 forks source link

DataCite Metadata Format in OAI (oai_datacite) #856

Open j3nsch opened 2 years ago

j3nsch commented 2 years ago

Im DINI-Zertifikat 2019 wird für die Auslieferung von Metadaten über die OAI-Schnittstelle empfohlen, neben dem Pflichtformat Dublin Core Simple zusätzlich das DataCite-Format zu verwenden. Im Zertifikatstext steht dazu:

"Die einzelnen Metadatensätze müssen im Standardformat Dublin Core Simple ausgeliefert werden, dessen Spezifikation u. a. vorsieht, dass jedes der insgesamt 15 Metadatenelemente optional ist, also entfallen kann, aber auch beliebig oft wiederholt werden darf. De facto sind Metadatensätze ohne dc:identifier Metadatum nicht adressierbar, so dass diese Angabe quasi verpflichtend ist. Ergänzend zu Dublin Core Simple empfehlen wir den Export von Metadaten im Schema DataCite, da hier mehr semantische Struktur exportiert werden kann. Wir empfehlen DataCite in Abwägung zu alternativen Formaten, da es im Rahmen der DOI-Vergabe in einem wachsenden Anteil der Repositorien bereits implementiert ist, übersichtlich und lesbar ist und eine Flexibilität hinsichtlich Formatdefinitionen hat.

...

Das OAI-PMH-Protokoll definiert Dublin Core Simple als Pflichtformat. In der Praxis hat sich aber herausgestellt, dass bei diesem Format der Vorzug der Flexibilität mit einer Unschärfe einhergeht, die sich negativ auf die Metadatenqualität auswirkt. Insbesondere lässt sich beobachten, dass ähnliche Inhalte in unterschiedliche Dublin Core - Tags zugeordnet werden, dass der Kontext der Inhalte nicht eindeutig identifiziert werden kann (z. B. welche Art Identifier für Autor*innen oder welche Klassifikation verwendet wird) oder zusammengesetzte Inhalte nicht korrekt in die einzelnen Bestandteile getrennt werden können. Die Kommutativität der Elemente bei gleichzeitig fehlender Spezifikation einer Binnenstruktur führt zu diversen spezifikationsfernen Implementationen. Geeignete strukturierte Metadatenformate liegen seit langem vor und werden in unterschiedlichem Umfang bereits genutzt. Für die Verwendung des DataCite-Formats sprechen:

● die zunehmende Relevanz der Vergabe von DataCite-DOIs für Ressourcen in Repositorien und entsprechender Metadaten ● die Möglichkeit der granularen Abbildung komplexer Dateninhalte ● die Übersichtlichkeit und Lesbarkeit des Formats ● die Flexibilität im Hinblick auf Änderungen der Formatdefinition ● die OpenAIRE-Kompatibilität

Empfehlungen E.A.4-1 Ergänzend zu einer Beschreibung mittels Dublin Core Simple wird das Objekt auch durch Metadaten entsprechend DataCite wenigstens in der Schema Version 4.2 beschrieben. DataCite Metadata Schema 4.2: https://schema.datacite.org/meta/kernel-4.2/. ● Benennung des Datenformats in OAI ist üblicherweise oai_datacite.

E.A.4-2 Wenigstens werden hierbei die Properties Identifier, Creator, Title, Publisher, PublicationYear und ResourceType angegeben. ● Diese müssen identisch zu den Feldern in DC gefüllt sein. ● Das Feld Identifier muss laut DataCite - Schema eine valide DOI enthalten."


Für die Planung haben wir folgende Wiki-Seite angelegt:

DataCite Metadata Format in OAI (oai_datacite)

Unter dieser Story sollen nun die eigentlichen Aufgaben für die Umsetzung in OPUS gesammelt und näher spezifiziert werden.

Intern: https://tickets.zib.de/jira/browse/OPUSVIER-4234

j3nsch commented 2 years ago

Die Beschreibung des DataCite Metadata Schema 4.3 ist hier zu finden: https://schema.datacite.org/meta/kernel-4.3/ (Released 16 Aug 2019)

Der neue empfohlene Metadata Prefix ist oai_datacite.

See Appendix in documentation for definitions, examples and usage notes: https://schema.datacite.org/meta/kernel-4.3/doc/DataCite-MetadataKernel_v4.3.pdf

XML Examples: Examples for various resource types and special cases can be found at http://schema.datacite.org/meta/kernel-4.3/index.html. XML Schema: The XML Schema is available here: http://schema.datacite.org/meta/kernel-4.3/metadata.xsd


Im Wiki DataCite Metadata Format in OAI (oai_datacite) haben BSZ und KOBV das Mapping für OPUS 4 beschrieben. Für einige Fälle besteht derzeit noch Abstimmungsbedarf mit der Entwicklung. Dazu werden dann eigene Unteraufgaben erstellt.

Es soll bei der Umsetzung darauf geachtet werden, dass oai_datacite so weit als möglich identisch mit dem DataCite-Format bleibt, das wir zur DOI-Registrierung verwenden. D.h. auch für die DOI-Registrierung wird es Tickets für eine Erweiterung geben.