Fuenfgeld / ATeamDatenmanagementUndArchivierung

MIT License
7 stars 0 forks source link

ETL Doku #35

Closed Fuenfgeld closed 3 years ago

Fuenfgeld commented 3 years ago

https://github.com/Fuenfgeld/ATeamDatenmanagementUndArchivierung/wiki/Datenbereinigung-im-ETL-Prozess

Hier Fehlt meiner Meinung nach eine Mapping Tabelle

Tabellen name (Stern Schemas)

Spalten Name Typ Beschreibung QuellDatenbank Quelltabelle QuellSpalte
Diagnose Code String Snomed Diagnose Code SourceDB Procedures Code

Eure Analysen zu Redundanzen und Unstimmigkeit würde ich in eine neue Seite Stellen. Dies gehört zum Thema Datenqualität.

Eure ETL Seite sollte links auf euren ETL Code im Git repository enthalten. Am besten Dokumentiert ihr eure ETL Jobs unter der Tabelle die diese ETL Jobs aufbauen.

fphans commented 3 years ago

@Carmen-Haubold , wolltest Du diese Mappingtabelle erstellen?

fphans commented 3 years ago

ETL-Dateipfade eingepfelgt unter ETL und Clearing

passt das so?

fphans commented 3 years ago

Mappingtbl

damit schliessen?

fphans commented 3 years ago

Link auch in der Sidebar eingepflegt

Carmen-Haubold commented 3 years ago

tb_patients

Hi, ich wollte mal fragen, ob in der Tabelle tb_patients, Spalte "COV_EXP_RATIO", was die Quellspalte ist und was man in der Beschreibung schreiben könnte?

Vielen Dank.

Grüße Carmen

lknegendorf commented 3 years ago

tb_patients

Hi, ich wollte mal fragen, ob in der Tabelle tb_patients, Spalte "COV_EXP_RATIO", was die Quellspalte ist und was man in der Beschreibung schreiben könnte?

Vielen Dank.

Grüße Carmen

Das ist ein Quotient aus den Spalten HEALTHCARE_COVERAGE und HEALTHCARE_EXPENSES, man könnte schreiben, dass es ein Score zwischen 0 und 1 ist, der den Anteil der versicherten Gesundheitskosten eines Patienten angibt o.ä.

BG, Leo

Carmen-Haubold commented 3 years ago

Vielen Dank.

lknegendorf commented 3 years ago

Top, danke! Eine Anmerkung noch, im Data Warehouse, also der "Forschungsdatenbank" haben die Tabelle nicht das Präfix 'tb_', also z.B. einfach nur 'encounters'. Das ist damit bei der Bezeichnung klar ist, ob die Source DB oder das Data Warehouse gemeint ist.

Carmen-Haubold commented 3 years ago

Du meintest hier im Navigationsmenü und in den Tabellenbezeichnungen? -> da habe ich es jetzt korrigiert

Mappingtabelle_Sideboard

Mappingtabelle_Tabelle

lknegendorf commented 3 years ago

Du meintest hier im Navigationsmenü und in den Tabellenbezeichnungen? -> da habe ich es jetzt korrigiert

Mappingtabelle_Sideboard

Mappingtabelle_Tabelle

YES! Great!