medizininformatik-initiative / Projectathon7-VHF

Repository für den 7. MII Projectathon
6 stars 1 forks source link

Ressourcen_IDs in Ergebnisse-CSVs im Projekt VHF-dezentral sind nicht pseudonymisiert #4

Closed KutSaleh closed 1 year ago

KutSaleh commented 1 year ago

Die Ressourcen-IDs in den Cohort- und Diagnoses-CSVs, welche als Ergebnisse an die DMSt ausgeleitet werden sollten, sind nicht pseudonymisiert.

astruebi commented 1 year ago

Bei VHF-dezentral muss in der config.toml (Docker) bzw. in der .RProfile (direkte Ausführung der R-Scripte) der Parameter DECENTRAL_ANALYSIS = TRUEsein. Das ist der Default.

Dadurch werden die CSV-Dateien vom Retrieval ins Verzeichnis outputLocal geschrieben. Dieses Verzeichnis wird nicht ausgeleitet. SONDERN das DIZ führt auch die Analyse bei sich aus. Dabei werden die Ergebnisse ins auszuleitende Verzeichnis outputGlobal geschrieben. Diese Ergebnisse (PDF-Plots, Textdateien, Logs) enthalten keinerlei Resourcen-IDs. Für VHF-dezentral muss also nicht pseudonymisiert werden.