Die Probleme in der vorherigen Implementierung (Datenbank.ipynb) sind in diesem Skript gelöst:
Die Faktentabelle wird erstmal mit den Daten aus Patienten.csv initialisiert. Es gibt ein Tuple pro Patient.
Die Einträge in jedem Tuple werden aus den weiteren csv Tabellen geholt.
Die Übertragung dieser Werte erfolgt mit Hilfe von Joins aufgrund der gemeinsamen Patienten ID.
Die Befehle in "create_statements_sql" wurden entsprechend geändert.
Zur Zeit heißt die neue Datenbank "Datawarehouse_new.db".
Dieser Name ist provisorisch und muss noch geändert werden.
In ETL2Datawarehouse_GS.ipynb umgesetzt. die "create_statements_sql" habe ich in das notebook mit integriert. Datenbank wird als CALICO_MA.db gespeichert. Siehe auch: Data/CALICO_MA_Database
Die Probleme in der vorherigen Implementierung (Datenbank.ipynb) sind in diesem Skript gelöst: Die Faktentabelle wird erstmal mit den Daten aus Patienten.csv initialisiert. Es gibt ein Tuple pro Patient. Die Einträge in jedem Tuple werden aus den weiteren csv Tabellen geholt. Die Übertragung dieser Werte erfolgt mit Hilfe von Joins aufgrund der gemeinsamen Patienten ID. Die Befehle in "create_statements_sql" wurden entsprechend geändert. Zur Zeit heißt die neue Datenbank "Datawarehouse_new.db". Dieser Name ist provisorisch und muss noch geändert werden.