robert-koch-institut / SARS-CoV-2-Infektionen_in_Deutschland_Archiv

Der vorliegende Datansatz enthält umfassende Informationen zu SARS-CoV-2-Infektionen in Deutschland, die gemäß dem Infektionsschutzgesetze (IfSG) von den Gesundheitsämtern an das Robert Koch-Institut (RKI) gemeldet wurden. Die Daten umfassen Informationen zur Anzahl der bestätigten Fälle, Todesfälle und Genesungen.
https://doi.org/10.5281/zenodo.4681153
Creative Commons Attribution 4.0 International
75 stars 6 forks source link

Inkonsistenzen zwischen diesem Archiv Repo und dem "aktuellem" Repo #36

Closed Rubber1Duck closed 7 months ago

Rubber1Duck commented 7 months ago

Hier ist am Wochenende was schief gelaufen. Die Datei in diesem Repo "2024-02-25_Deutschland_SarsCov2_Infektionen.csv.xz" hinzugefügt mit commit "update 2024-02-26" stimmt vom Inhalt her mit der Datei "Aktuell_Deutschland_SarsCov2_Infektionen.csv" im "aktuellem" Repo mit commit "update 2024-02-26" überein, und müsste demnach "2024-02-26_Deutschland_SarsCov2_Infektionen.csv.xz" heissen! ebenso die Datei "2024-02-24_Deutschland_SarsCov2_Infektionen.csv.xz" hinzugefügt mit commit "update 2024-02-25" stimmt vom Inhalt her mit der Datei "Aktuell_Deutschland_SarsCov2_Infektionen.csv" im "aktuellem" Repo mit commit "update 2024-02-25" überein, müsste also "2024-02-25_Deutschland_SarsCov2_Infektionen.csv.xz" heissen.

Demnach fehlt auch noch das Archiv vom 24.02.2024! Meiner bescheidenen Meinung nach müsste also folgendes getan werden:

  1. umbennen der Datei 2024-02-25_Deutschland_SarsCov2_Infektionen.csv.xz -> 2024-02-26_Deutschland_SarsCov2_Infektionen.csv.xz
  2. umbenenn der Datei 2024-02-24_Deutschland_SarsCov2_Infektionen.csv.xz -> 2024-02-25_Deutschland_SarsCov2_Infektionen.csv.xz
  3. hinzufügen der Datei 2024-02-24_Deutschland_SarsCov2_Infektionen.csv.xz

@HannesWuensche können sie sich das mal ansehen?! Danke

Rubber1Duck commented 7 months ago

es schein wieder alles in Ordnung zu sein .....

HannesWuensche commented 7 months ago

Hallo @Rubber1Duck ,

vielen Dank für den direkten und detaillierten Hinweis. Hier unsere Erläuterung:

Die im Archiv vorhandenen Dateien sind richtig benannt und datiert. Falsch ist die Datierung der Tags und der Commit Messages.

Hintergrund ist, dass unsere Publikationprozess am Samstag durch einen Netzwerk-Fehler ausgelöst wurde, bevor neuen Daten vorhanden waren. Entsprechen gab es kein Diff und auch keine Publikation. Am Sonntag ist der Netzwerkfehler ebenfalls aufgetreten und hat dann aber die Daten von Samstag als neue Daten erkannt und publiziert. Am Sonntag sind so die Daten vom Samstag publiziert wurden, analog heute für die Daten von Sonntag.

Wir haben heute eine Umstellung vorgenommen, sodass der Fehler nicht wieder auftreten sollte. Die Einträge auf Zenodo sind entsprechend angepasst. Ebenso die Tags in beiden Repositories.

Da aus den Aktuell_Deutschland_SarsCov2_Infektionen.csv kein Datum auslesbar ist. Wiegt der Fehler im SARS-CoV-2-Infektionen_in_Deutschland Repository schwerer. Um nicht per force Push in die Commit-Historie einzugreifen, passen wir Commit Messages und Metadaten nicht rückwirkend an. Wir werden es entsprechend mit einem Hinweis versehen.

Beste Grüße @HannesWuensche für das Team RKI | Open Data