Fuenfgeld / DMA2024TeamC

MIT License
2 stars 0 forks source link

Unsere facts_table wird nicht aufgefüllt #14

Closed moanesga closed 7 months ago

moanesga commented 7 months ago

Ich habe INSERT INTO sql-Anweisungen verwendet. Ich habe gesehen, dass andere teams Joins in Abfragen verwendet haben, um Diagramme zu erstellen, nicht direkt aus der facts_table. Ich habe dies auch versucht, aber die RAM-Kapazität war erreicht und die Abfrage wurde nicht ausgeführt. Als Alternative habe ich wieder Tableau Prep verwendet, um eine facts_table zu haben, die direkt zum Plotten und Analysieren verwendet werden kann.

HaSzyBS commented 7 months ago

In ETL2Datawarehouse.ipynb habe ich das Datawarehouse modifiziert, mit Hilfe von UPDATE statt INSERT INTO. In dieser Version werden die einzelnen Encounters nicht mehr in die Faktentabelle gespeichert. Stattdessen werden bei jedem Patienten die gesamten Kosten für die jeweiligen Tätigeiten direkt in die Datenbank gespeichert. Die Faktentabelle ist damit komplett aufgefüllt und nicht mehr so groß: Krebsart, Patient_ID, geographische Koordinaten, Geburtsdatum, letzter QALY-Wert, Datum des letzten QALY-Wert, totale healthcare Kosten, Kostensumme für jeweils Encounters, Observations, Procedures, Medications und Immunizations.