zazuko / elcom-strompreis-poc

PoC ElCom Strompreise LD
0 stars 0 forks source link

ElCom Strompreis RDF Pipeline

Daten der Eidgenössischen Elektrizitätskommission ElCom zu Strompreisen werden durch diese Pipeline nach RDF überführt.

Die Pipeline baut dabei auf das für das Bundesarchiv entwickelte, generische Pipelining-System auf. Details zu dem System können der entsprechenden Dokumentation entnommen werden. Das System ist vollständig als Open Source Software verfügbar und kann einfach auf Unix ähnlichen Systemen (Linux, MacOS, Windows mit WSL 2) installiert und verwendet werden.

Installation

Um die Pipeline selber ausführen zu können, sind folgende Voraussetzungen zu erfüllen:

Die Pipeline kann auch in einem vorkonfigurierten Docker-Container verwendet werden. Dieser Container enthält sämtliche benötigten Werkzeuge und Umgebungen.

Ausführen der Pipeline

Wenn Node.js & Apache installiert ist, können die Abhängigkeiten installiert werden: npm install

Nach dem installieren der Abhängigkeiten kann die Pipeline in verschiedenen Konfigurationen gestartet werden, die verschiedenen Variationen können durch npm run ausgegeben werden.

Bei lokalen Tests sollte die Pipeline mit dem Namen tariff ausgeführt werden:

npm run tariff

In dieser Konfiguration werden die Daten als RDF (N-Triples) in eine Datei auf dem lokalen Dateisystem geschrieben.

Die Pipeline kann in einer privaten GitLab Umgebung als CI/CD Job ausgeführt werden, welche die entsprechenden Passwörter für die Zugänge zur Verfügung stellt. Dazu wird der oben verlinkte Docker-Container verwendet und GitLab über die .gitlab-ci.yml Datei gestartet.

Die tägliche Ausführung könnte über GitLab Pipeline Schedules verwaltet werden, welche den GitLab CI/CD Job startet.

Implementation der Pipeline

Die Pipeline besteht aus folgenden Schritten: