bundesAPI / sofortmassnahmen

Zivilgesellschaftliche Beteiligung zu den „Sofortmaßnahmen Zweites Open Data Gesetz“
96 stars 3 forks source link

Schulverzeichnisse der Länder als JSON für die OpenData-Portale der Länder, auf welches das OpenData-Portal des Bundes zugreift. #18

Open linux-lukas opened 3 years ago

linux-lukas commented 3 years ago

Das Ministerium für Schule und Bildung des Landes Nordrhein-Westfalen (MSB NRW) stellt unter https://www.schulministerium.nrw.de/BiPo/SchuleSuchen/pages/schulsuche/schule_formular.xhtml eine Möglichkeit bereit, Schulstammdaten über eine (in meinen Augen keiner intuitiven) grafischen Weboberfläche anzufragen. Ich habe bisher keine Möglichkeit gefunden, da eine API ansprechen zu können.

Wenn es eine Möglichkeit gäbe, eine API anzusprechen und einen JSON-File zu generieren mit dem Inhalt, könnte man diese ins OpenData-Portal des Land NRW (open.nrw) über einen automatischen Prozess, der die API abfragen würde und in das OpenData-Portal einspeisen könnte.

Ähnliche Plattformen wird es wohl in anderen Bundesländern geben.

LilithWittmann commented 3 years ago

Hey @Lukas2112, sehr cool, möchtest Du die dokumentieren? Dann lege ich Dir ein Repo an.

linux-lukas commented 3 years ago

Ich kann es gerne versuchen zu dokumentieren.

Auf den ersten Blick scheint es mir die Herangehensweise vom Handelsregister (in Teilen) übernehmen zu können.

linux-lukas commented 3 years ago

Ich bin bei einer erweiterten Interrecherche auf das Online-Portal "ChoiceLab" aufmerksam geworden, was vielleicht spannend sein könnte: https://www.choicelab.de/schools

LilithWittmann commented 3 years ago

@Lukas2112 das werden wir vmtl nicht als Quelle benutzen können. Weil in privater Hand.

linux-lukas commented 3 years ago

Könnte eine IFG-Anfrage, an die Kultusministerien der Länder helfen?

sknebel commented 3 years ago

Arbeit in Richtung Scraper gibt es schon unter https://github.com/Datenschule/jedeschule-scraper

auchtetraborat commented 3 years ago

Der jedeschule-scraper benutzt als Datenquelle https://www.schulministerium.nrw.de/BiPo/OpenData/Schuldaten/schuldaten.csv.

Ich hab mal nen kleinen Scraper für die oben verlinkte Website geschrieben. Beides gibt eine unterschiedliche Anzahl an Ergebnissen zurück, das CSV enthält 5507 Zeilen, die Website 5412 Ergebnisse. Die Differenz gibt sich aber, wenn man alle Schulämter (Schulnummner 6xxxxx) sowie alle Schulen mit den Schulbetriebsschlüsseln (https://www.schulministerium.nrw.de/BiPo/OpenData/Schuldaten/key_schulbetriebsschluessel.csv) 6 (nur bestimmte Erhebung) und 9 (Löschung zum Jahresende) rausnimmt. Wahrscheinlich wird einfach nach Schulbetriebsschlüssel == 2 (in Betrieb) gefiltert.

Die Datenquelle ist auch schon im OpenData Portal von NRW: https://open.nrw/dataset/schulgrunddaten_nrw_1572515479 und wird dort als XML angeboten. Es gibt sie zudem als CSV, wenn man die Endung ersetzt, als JSON leider nicht.

Eine API, um die nur die Infos einer einzigen Schule abzurufen, wäre trotzdem sehr praktisch.

Scraper: https://github.com/auchtetraborat/nrw-school-scraper-compare