Reproduzierbarkeit: ermöglicht durch die Versions-kontrolle in GIT (verschiedene Versionen der Ergebnisse können wiederhergestellt werden)
Findable
Code und Dokumentation in GIT-Versionsverwaltung
Metadaten im Wiki (z.b. CSV-Modell Beschreibung, Stern-Schema ER-Modell)
Beschreibung der Arbeitsschritte und Code-Segmente im Wiki bzw. als Textbausteine im Colab-book
Externe Referenzen (z.b. SNOMED CT) werden klar aufgezeigt (Link zu SNOMED einfügen)
Accisible
GITHUB als Web-basiertes Werkzeug bietet eine einfache (grafische Benutzeroberfläche), strukturierte (Versionsverwaltung) und sicherer (https) Möglichkeit, auf Daten, Code und Dokumentation zuzugreifen; Es ist keine Anmeldung erforderlich, man kann als annoymer Nutzer zugreifen
Lediglich ein Google-Konto ist erforderlich, um auf die "geteilten" CSV-Daten und die Google Colab-Platform zur Ausführung von Code zugreifen zu können
Zugriffsberechtigungen werden von den Platformen GITHUB und GOOGLE bereits zur Verfügung gestellt...
Verwendung ausschließlich von OSS, alle Verwender können ohne weitere Einschränkungen auf Code zugreifen und ausführen (keine individuellen SW-Lizenzen nötig)
Diese können auch unabhängig von der gewählten Präsentationsplatform (hier Google Colab) verwendet werden
Codierungen für medizinische Fakten aus dem SNOMED-CT Standard übernommen
ETL-Prozess (CSV zu DWH) kann unabhängig von lokalen Daten immer ausgeführt werden, Quell-Daten befinden sich in geteiltem GDrive-Ordner
Reusable
Code + Daten sind (anonymisiert) freigegeben, damit andere die Erkentnisse nachvollziehen können und die Daten für eigene Analysen weiter verwenden können
COVIR-Projekt ist in GITHUB öffentlich verfügbar und kann von jedem "geforked" werden. Das Quellprojekt kann entspredend der OSS-Entwicklungsparadigmen von externen Entwicklungen profitieren.
Garantierte bereitstellung von CODE+Doku über GitHub und Daten über Google für min. 10 Jahre.
Beschreibung der verwendeten Software-Bibliotheken und der verwendeten Versionen um Ausführbarkeit zu garantieren.
Ablauf des ETL-Prozesses und Aufbau (Tabellen-Schema) des Date-Warehouses ist in Doku klar beschrieben und für dritte jederzeit nachvollziehbar, um eigene Abfragen zu formulieren
FAIR Prinzip
Reproduzierbarkeit: ermöglicht durch die Versions-kontrolle in GIT (verschiedene Versionen der Ergebnisse können wiederhergestellt werden)
Findable
Accisible
Interoperable
Reusable