GovDataOfficial / ckanext-dcatde

DE: Dieses Repository beinhaltet die Erweiterung von ckanext-dcat auf die Spezifikation DCAT-AP.de. EN: This is a DCAT-AP.de specific CKAN extension for providing and importing DCAT-AP.de-Profile data.
http://www.dcat-ap.de/
GNU Affero General Public License v3.0
11 stars 10 forks source link

Zuordnen von Datensätzen zu Herausgebern #19

Open jze opened 1 year ago

jze commented 1 year ago

DCAT-AP.de sieht vor, dass in einem Katalog Datensätze mehrerer Herausgeber enthalten sind. Im Konventionenhandbuch ist angegeben, dass der dct:publisher angegeben werden MUSS. https://www.dcat-ap.de/def/dcatde/2.0/implRules/#angaben-zum-herausgeber

Der CKAN-CKAN-Harvester sieht bereits eine Möglichkeit vor, Datensätze auf Herausgeber zu verteilen. Dabei gibt es sogar die Möglichkeit, noch fehlende Herausgeber automatisch anzulegen. Hier ist die Stelle im Code: ckanharvester.py

Auch im DCAT RDF-Harvester ist bereits vorgesehen, dass der Datensatz von einem anderen Herausgeber als die Harvest-Source stammt: rdf.py Damit das aktiv wird, muss aber ein IDCATRDFHarvester (Aufruf in rdf.py) einen Eintrag dataset['owner_org'] erzeugen.

Meine Idee ist es, im DCATdeProfile entsprechende Logik einzubauen. Dabei würde ich analog zum CKAN-CKAN-Harvester vorgehen. Nur wenn die Konfiguration remote_orgs gesetzt ist, wird die Logik überhaupt aktiv. Auf Basis von dataset['publisher_name'] wird dann ein Herausgeber gesucht.

Klingt das sinnvoll? Dann würden wir uns an der Umsetzung versuchen.

seitenbau-govdata commented 1 year ago

Das wäre eine sehr nützliche Funktionalität. Danke für die Umsetzung. Falls Fragen aufkommen meldet euch gerne.