Fuenfgeld / DMA2024TeamC

MIT License
2 stars 0 forks source link

Erstellen der source Datenbank #3

Closed schmidgu closed 9 months ago

schmidgu commented 9 months ago

Benutzen sie die als Colab book angehängte Beispiel Implementierung als Hilfsmittel.

Erstellen sie ein GoogleColabbook.

Datenbank Dokumentation:

Erstellen sie eine Seite Pro Tabelle. Diese Seite sollte folgende Informationen enthalten.

moanesga commented 9 months ago

Die Datenbank wurde aus zuvor zusammengeführten Tabellen (patients, observations, procedures, medications, immunizations and encounters) der drei Krebsarten (breast, colorectal and lung) erstellt. Eine facts_table fasst alle wichtigen Attribute zur Beantwortung unserer Forschungsfragen zusammen. Die Datenbank datawarehouse.db kann über den folgenden Link aufgerufen werden: Link

HaSzyBS commented 9 months ago

Ich habe die Übertragung der "patients" Daten in die Facts_table nicht gefunden. Ich bin mir nicht sicher, ob so etwas auch stehen sollte:

cur.execute('''INSERT INTO facts_table (cancer_type, patient_ID, patient_Birthdate, patient_LAT, patient_LON, patient_Healthcare_expenses, patient_Healthcare_coverage) SELECT Table_Names, PATIENT, BIRTHDATE, LAT, LON, HEALTHCARE_EXPENSES, HEALTHCARE_COVERAGE FROM patients ;''')

oder habe ich falsch verstanden?

moanesga commented 9 months ago

facts_table ist nicht vollständig ausgefüllt, ich brauche Hilfe bei der Überprüfung von INSERT INTO sql-Anweisungen. Als Option b, um Verzögerungen beim nächsten Schritt "Explorative Datenanalyse" zu vermeiden, wurde die Datei Fact_table.csv erstellt und kann im freigegebenen Google drive aufgerufen werden; sie ist bereits in die Datei EDA.ipynb geladen.

HaSzyBS commented 9 months ago

Probleme in der Erstellung der Datenbank wurden gelöst. Datenbank.ipynb wurde durch ETL2Datawarehouse.ipynb ersetzt.