alinaabro / Wissenschaftliches-Arbeiten-GitHub-Projekt

Titanic data
0 stars 2 forks source link

Titanic Datensatz Analyse für Wissenschaftliches Arbeiten

Willkommen im GitHub-Repository zur Analyse des Titanic-Datensatzes, einem Projekt für das Modul "Wissenschaftliches Arbeiten". Ziel dieses Projekts ist es, durch eine detaillierte Untersuchung des berühmten Titanic-Datensatzes Einblicke in die Statistiken und Zusammenhänge der Daten zu gewinnen.

Überblick

Dieses Projekt konzentriert sich auf die Analyse des Titanic-Datensatzes, der Informationen über die Passagiere des unglücklichen Schiffs enthält. Wir beschäftigen uns mit der Aufbereitung und Analyse dieser Daten, um ein tieferes Verständnis für die Variablen zu erlangen, die das Überleben der Passagiere beeinflusst haben könnten. Dazu gehören deskriptive Statistiken, die Analyse von Zusammenhängen zwischen kategorialen und metrischen Variablen sowie zwischen zwei kategorialen Variablen und die Erstellung aussagekräftiger Visualisierungen.

Projektstruktur

Das Repository ist wie folgt organisiert:

Datensatzvorbereitung.R: Die Vorbereitung der Daten für die Analyse erfolgt in dieser Datei.

Funktion-R-Skript 1.R: In dieser Datei sind die Funktionen enthalten, die dazu dienen den Datansatz zu Analysieren.

Funktion-R-Skript 2.R: In dieser Datei sind Helfer-Funktionen enthalten die Anwendung in den Funktionen aus dem ersten RSkript finden.

TitanicDatenAnalyse.R: Enthält die aufgerufenen Funktionen aus RSkript 1 für bestimmte Variablen.

Titanic.csv:Diese Datei enthält den noch nicht aufbereiteten Titanic-Datensatz, der als Grundlage für unsere Analysen dient.

Wiki: Ein ausführlicher Bericht über die Ergebnisse und die angewandten Methoden ist im Wiki dieses Repositories zu finden.

Hauptmerkmale

Datenaufbereitung: Bereinigung und Transformation des Datensatzes für die Analyse.

Deskriptive Statistik: Funktionen zur Analyse von kategorialen und metrischen Variablen sowie deren Zusammenhänge.

Visualisierungen: Erstellung von Diagrammen und Grafiken zur Darstellung kategorialer Variablen und zur Illustration statistischer Zusammenhänge.

Analyse von Variablenbeziehungen: Untersuchung des Zusammenhangs zwischen verschiedenen Variablen im Datensatz.

Anwendung der Funktionen: Alle entwickelten Funktionen werden auf spezifische Variablen im Datensatz angewandt, um konkrete Einsichten zu gewinnen.