gast-dan / Gruppenarbeit_wiss_arbeiten

0 stars 3 forks source link

Diskussion der Ergebnisse #12

Open liianaa opened 2 years ago

liianaa commented 2 years ago

Mit Hilfe der Datenanalyse kann man also feststellen, dass 1) der Alter der Studierenden beträgt im Durschnitt 25.21 Jahre mit einer Standardabweichung von 1.810714 2) statistik kommt als Studienfach am häufigsten vor 3) das Interesse an Mathematik beträgt bei meisten Studierenden 5 4) die Kovarianz zwischen Interesse an Mathe und Mathe-LK in der Schule beträgt 0.3583838. Dieses Ergebnis zeigt, dass ein positiver Zusammenhang besteht. Wenn also die Variable 'Interesse‘ steigt,steigt auch die Variable 'Mathe-LK‘ 5) dagegen ist die Kovarianz zwischen Interesse an Programmieren und Interesse an Mathematik negativ, d.h. wenn die eine Variable steigt, die andere sinkt. 6) die Korrelation zwischen Mathe-LK und Alter beträgt 0.1320068, ist also positiv, d.h. es besteht ein Zusammenhang zwischen den beiden Variablen

gast-dan commented 2 years ago

War denn beim zweiten Punkt Statistik sehr deutlich am häufigsten?

JonaMessling commented 2 years ago

Ich finde Punkt 5 und 6 interessant. Eigentlich hätte sich hier kein Zusammenhang ergeben sollen oder? @gast-dan. Zu 6: Ein Korrelationskoeffizient von 0.132 ist auch nicht besonders hoch oder? Das würde ich noch als Zufall verbuchen. Den Zusammenhang zwischen Interesse an Mathe und Mathe-LK habt ihr aber richtig erkannt! Das war in jedem Fall so gedacht. :)

gast-dan commented 2 years ago

Ich würde mal auch vermuten, dass das eher durch Zufall so herausgekommen ist bei 5 und 6.

Wie groß ist denn die negative Kovarianz zwischen Interesse an Programmieren und Interesse an Mathematik? @liianaa @GoFisch

liianaa commented 2 years ago

Statistik, Data Science und Mathe sind eigentlich sehr nah zueinander, mit den relativen Häufigkeiten von 0.34, 0.27, 0..26. Informatik dagegen beträgt nur 0.13.

liianaa commented 2 years ago

Die Kovarianz zwischen Interesse an Programmieren und Interesse an Mathematik beträgt -0.3349495, ist also nicht zu hoch :)

gast-dan commented 2 years ago

Statistik, Data Science und Mathe sind eigentlich sehr nah zueinander, mit den relativen Häufigkeiten von 0.34, 0.27, 0..26. Informatik dagegen beträgt nur 0.13.

Das ist recht nah an den echten Wahrscheinlichkeiten. Eingestellt war es als Statistik = 0.3, DataScience = 0.3, Mathe = 0.28 und Informatik = 0.12 ^^

Das mit der Kovairanz ist interessant, eigentlich solten zwischen den beiden keine wirkliche Abhängigkeit existieren, aber vielleicht sind die Zufallszahlen einfach so gelandet, sind ja auch nur 100 Beobachtungen.

JonaMessling commented 2 years ago

Finde -0.3349495 auch gar nicht so wenig, aber kann nur Zufall sein, sehe in unserem Skript nicht, woher eine Abhängigkeit zwischen Interesse_Programmieren und Interesse_Mathematik kommen sollte. Ansonsten sieht es ja aber gut aus!

liianaa commented 2 years ago

Und noch zum Interesse an Mathematik : Mit Hilfe der Funktion "kategorial_stat" haben wir diese relativen Häufigkeiten bekommen: 0.18 0.19 0.09 0.09 0.21 0.08 0.16 , d.h. es gibt deutlich wenigere Studenten die ein Interesse von 3, 4 oder 6 haben, dagegen liegen die Werte 1,2,5,7 sehr nahe beieinander. Daraus und auch aus den Ergebnissen der Funktion ordinal_kategorie kann man folgen, dass die meisten Studenten entweder geringes oder hohes Interesse an Mathe haben, das mittlere Interesse kommt selten vor.

GoFisch commented 2 years ago

Ansonsten sieht man in der Visualisierung noch ganz gut einen Zusammenhang zwischen Interesse_Programmieren und den Studienfächern. Besonders in dem Graph von kat_vektor1/kat_vektor3 sieht man in den Fächern Mathe und Statistik deutlich mehr Studierende bei denen Interesse_Programmieren bei 3 oder weniger liegt. Wobei Data Science mit Abstand die meisten Studierende mit Interesse 6 oder mehr hat.

GoFisch commented 2 years ago

Ich würde auch einen Zusammenhang zwischen dem Fach Informatik und Interesse_Programmieren vermuten, aufgrund von Graph kat_vektor3/kat_vektor1. Da bei den Boxplots der Median zwischen Informatik und Interesse_Programmieren noch relativ hoch ist. Zwar nicht so hoch wie bei Data Science (Median: 5), liegt aber trotzdem bei 4 im Vergleich zu Mathe und Statistik mit jeweiligem Median 3.

gast-dan commented 2 years ago

Zwischen den Fächern Informatik und Data Science und dem Interesse_Programmieren besteht auch ein Zusammenhang. Für die beiden werden höhere Zahlenwerte mit einer größeren Wahrscheinlichkeit gezogen. Für die anderen Fächer besteht Interesse_Programmieren aus gleichverteilten Zufallszahlen.