Fuenfgeld / 2022TeamADataEngineeringBC

This is a repository for a Data Engineering Tutorial
MIT License
0 stars 2 forks source link

Daten für Workshop suchen / erstellen #12

Closed niklasbuechner closed 2 years ago

niklasbuechner commented 2 years ago

Es gibt im medizinischen Bereich viele synthetische Datensätze, die wir verwenden können. Viele davon kommen von Synthea. Ich würde vorschlagen, dass wir uns einfach davon einen Datensatz schnappen. Die Datensätze haben aber meisten tausende Tabellenzeilen. Daher ist mein Vorschlag, dass wir die Daten dann einfach auf eine handvoll Zeilen reduzieren, die unseren Anforderungen entsprechen und die dann nutzen.

niklasbuechner commented 2 years ago

Hier ein paar der Download Links:

Auch die anderen Abschlussprojekte könnten wir nutzen, um an Daten zu kommen, falls diese die Daten in GitHub eingecheckt haben.