bertelsmannstift / Musterdatenkatalog

12 stars 4 forks source link

Musterdatenkatalog

Der Musterdatenkatalog schafft einen Überblick über die offenen Daten, die Kommunen in Deutschland der Allgemeinheit zur Verfügung stellen.

Hintergrund des Musterdatenkatalogs

Wer bis jetzt die offenen Daten über eine einzelne Kommune hinaus nutzen wollte, musste viel Zeit aufwenden, um sich einen Überblick zu verschaffen. Ebenso bekommen Kommunen bisher nur schwer eine Übersicht darüber, welche Daten sich zur Veröffentlichung als Open Data eignen. Das Ziel des Musterdatenkatalogs ist es, eine gute Übersicht über Open Data in Kommunen zu verschaffen. Der Musterdatenkatalog wurde im Rahmen des Projekts Smart Country der Bertelsmann Stiftung gemeinsam mit GovData, dem KDZ – Zentrum für Verwaltungsforschung (Wien) und der Open Knowledge Foundation Deutschland sowie Kommunen entwickelt.

Eine erste 2019 veröffentliche Version des Musterdatenkatalogs umfasst die offenen Daten von Open-Data-Vorreiterkommunen in Nordrhein-Westfalen und diente als Prototyp. Die zweite im April 2020 veröffentlichte Version des Musterdatenkatalogs umfasste bereits alle Kommunen in Nordrhein-Westfalen, deren offene Daten über das Open.NRW-Portal auffindbar sind. Die dritte veröffentlichte Version des Musterdatenkatalogs (veröffentlicht Anfang März 2021) umfasst alle offenen Daten von Kommunen und kommunalen Dienstleistern, die über das bundesweite Open-Data-Portal GovData auffindbar sind. Der neue Musterdatenkatalog schafft somit erstmals bundesweit einen Überblick über die offenen Daten, die Kommunen der Allgemeinheit zur Verfügung stellen.

Kernfunktionen des Musterdatenkatalogs

Bisher stellen rund 150 Kommunen in Deutschland, darunter viele Großstädte von Kiel bis München, aber auch einige Klein- und Mittelstädte, offene kommunale Daten zur Verfügung. Der Musterdatenkatalog ordnet die Datensätze rund 60 verschiedenen kommunalen Themenbereichen zu. Interessenten können sich dank des Katalogs zum Beispiel alle offenen Daten einer Kommune oder die offenen Daten unterschiedlicher Kommunen zu einem bestimmten Thema anzeigen lassen. Dies erhöht die Vergleichbarkeit der Daten und kann gleichzeitig Anreize für Kommunen schaffen, weitere offene Daten bereitzustellen. Der bundesweite Musterdatenkatalog wurde mit einem Machine-Learning-Algorithmus automatisiert erstellt.

Machine Learning

Der bundesweite Musterdatenkatalog wird automatisiert mit einem Algorithmus erstellt. Dieser ordnet die offenen Daten in die über 300 Musterdatensätze ein. Wir haben den Algorithmus umfangreich trainiert, aber eine hundertprozentige Zuordnung aller Datensätze kann so nicht gelingen. Dafür gibt es vor allem drei Gründe:

Mehr Informationen hier.

Fragen & Antworten

Warum fehlen im Musterdatenkatalog manche Kommunen, die bereits offene Daten veröffentlichen?

Im Musterdatenkatalog führen wir offene Daten zusammen, die im Portal GovData.de abrufbar sind. Dort sind keine kommunalen Daten aus den Bundesländern Bayern, Niedersachsen, Sachsen-Anhalt und Saarland abrufbar. Ein Abruf der Daten aus Open-Data-Landesportalen (die die meisten der genannten vier Bundesländer nicht haben) oder aus kommunalen Portalen wäre zu aufwändig. Sollten künftig die Daten aus Kommunen der vier genannten Bundesländer auf GovData verfügbar sein, werden diese auch in den Musterdatenkatalog mit aufgenommen.

Wird der Musterdatenkatalog automatisch aktualisiert, sobald eine Kommune offene Daten veröffentlicht?

Nein. Der Musterdatenkatalog kann nicht automatisch bei jeder neuen Veröffentlichung offener Datensätze aktualisiert werden. Eine Aktualisierung wird von der Bertelsmann Stiftung in Auftrag gegeben. Aktuell planen wir eine Aktualisierung des Musterdatenkatalogs 2 Mal pro Jahr.

Wer hat an der Erstellung des Musterdatenkatalogs mitgewirkt?

Der Musterdatenkatalog wurde zunächst als Prototyp im Mai 2019 veröffentlicht. Der Erstellung des Prototypen gingen drei Workshops in Köln voraus, zu denen GovData und die Bertelsmann Stiftung mehr als 20 Expert*innen aus der Open-Data-Community eingeladen haben. Die Ergebnisse der Workshops wurden in enger Abstimmung mit Vertreter*innen der Städte Bonn, Düsseldorf, Köln und Moers sowie mit dem IT-Dienstleister kdvz Rhein-Erft-Rur vertieft und mündeten in dem im Mai 2019 veröffentlichten Prototypen. Dieser bildete die Grundlage für die anschließende Entwicklung eines NRW-Musterdatenkatalogs durch die Projektpartner Bertelsmann Stiftung, GovData, KDZ – Zentrum für Verwaltungsforschung und Open Knowledge Foundation Deutschland gemeinsam mit Open.NRW. Der bundesweite Musterdatenkatalog ist eine Weiterentwicklung des Prototoypen und der NRW-Version. Die technische Umsetzung des Musterdatenkatalogs erfolgte durch Mila Frerichs (Civic Vision).

In meiner Kommune wurden bereits Datensätze veröffentlicht, die im Musterdatenkatalog nicht auftauchen. Warum?

Im Musterdatenkatalog wurden offene Daten berücksichtigt, die bis zu einem jeweiligen Stichtag auffindbar waren. Daten, die nach diesem Stichtag veröffentlicht wurden, können erst nach einer weiteren Aktualisierung Eingang in den Musterdatenkatalog finden.

Weiterführende Links