Closed schmidgu closed 9 months ago
Die Datenbank wurde aus zuvor zusammengeführten Tabellen (patients, observations, procedures, medications, immunizations and encounters) der drei Krebsarten (breast, colorectal and lung) erstellt. Eine facts_table fasst alle wichtigen Attribute zur Beantwortung unserer Forschungsfragen zusammen. Die Datenbank datawarehouse.db kann über den folgenden Link aufgerufen werden: Link
cur.execute('''INSERT INTO facts_table (cancer_type, patient_ID, patient_Birthdate, patient_LAT, patient_LON, patient_Healthcare_expenses, patient_Healthcare_coverage) SELECT Table_Names, PATIENT, BIRTHDATE, LAT, LON, HEALTHCARE_EXPENSES, HEALTHCARE_COVERAGE FROM patients ;''')
facts_table ist nicht vollständig ausgefüllt, ich brauche Hilfe bei der Überprüfung von INSERT INTO sql-Anweisungen. Als Option b, um Verzögerungen beim nächsten Schritt "Explorative Datenanalyse" zu vermeiden, wurde die Datei Fact_table.csv erstellt und kann im freigegebenen Google drive aufgerufen werden; sie ist bereits in die Datei EDA.ipynb geladen.
Probleme in der Erstellung der Datenbank wurden gelöst. Datenbank.ipynb wurde durch ETL2Datawarehouse.ipynb ersetzt.
Benutzen sie die als Colab book angehängte Beispiel Implementierung als Hilfsmittel.
Erstellen sie ein GoogleColabbook.
Datenbank Dokumentation:
Erstellen sie eine Seite Pro Tabelle. Diese Seite sollte folgende Informationen enthalten.