Open annahdk opened 3 years ago
mit Vorsicht zu interpretierende Variablen? race (welche gruppen sind das?) vgl ethnien USA kann man nicht zuordnen, aber wieso sollte man auch unbedingt? -> Einflüsse, bzw. quoten kann man nicht bestimmen -> Ist im Hinblick auf die Fragen nicht so wichtig
ist halt auch ein fiktiver Datensatz
Bildungsniveau Eltern eig ja zwei Eltern, welchen Abschluss genommen? höchster, niedrigster Abschluss, Elternteil mit dem meisten Kontakt zum Kind
Teilnahme am Vorkurs, completed/nichtteilnahme gibt keine kategorie teilgenommen, gruppen sind unterschiedlich groß (großer Unterschied)
QQ Plots bei Tests auf Normalverteilung -> Abweichungen von der Winkelhalbierenden an den Rändern -> Normalverteilung passt schon zu den meisten Daten, aber nicht so sehr an den Rändern
empirische varianzen vor bartlett test berechnen?
DIE HABEN ABSOLUTE HÄUFIGKEITEN BEI HISTOGRAMMEN ANGEGEBEN!!!!!!!!!!!!!!!!!
Kerndichteschätzung passt nicht zu den Daten Approximation eines Histograms um empirische Dichte an den Rändern abgeschnitten, weil beschränktes Intervall (kann man auch einfach drauf hinweisen) Ränder mit einarbeiten, wenn man wirklich möchte (wir wahrscheinlich nicht)
Einfach mit Histogrammen machen, dann aber bitte mit Dichte
Im Bericht genau erklären warum man das so sagt Scores als kardinal oder als ordinal? Diskussion, muss man drauf achten. Kann man als beides angeben. ABER: Noten sind Bewertung aufgrund von Punkten? metrisch oder ordinal? Punkte sind Versuch Leistung symmetrisch zu gestalten
Doebler: Viele Merkmalsausprägungen am Ende muss man immer stetig annehmen
Deutschland: berechnet Abiturnoten als Durchschnitt eines 15-Punkte-Systems (zumindest NRW?) -> Beispiel, das für Kardinalität spricht
"Normalverteilung von Schulnoten" https://www.fr.de/wissen/angst-guten-noten-11602814.html
Median gleich Mittelwert, warum fallen sie nicht auseinander? Warum fallen sie auseinander? Diskussion
0, 1, 2,..., 99, 100 natürliche Zahlen
normalverteilt, eigentlich nicht nur natürliche Zahlen weil stetig Normalverteilung, keine beschränkte Dichte Nullhypothese nicht abgelehnt, heißt nicht normalverteil Weil n=150 nicht unbedingt so groß ist, mehr Daten, fällt eig. auf, dass keine Normalverteilung ist
Wieso verwenden wir sie dann trotzdem? ist die Annahmenverletzung so ein großes Problem? Für die Hypothesentests!!! Nichtparametrische Ansätze?
Unabhängigkeit der Stichproben irgendwie erklären
Exakter Test nach Fisher stellt keine Voraussetzungen an die Stichprobe (geht auch bei kleinen Stichproben)
wir wollen jonas !!! jonas == Luca [1] TRUE
METHODEN:
Stärkster Einfluss mit Hedges???
Bei Hedges G sigma1 + sigma2
Approximation S. 20 je größer Stichprobenumfang desto näher an chi quadrat Verteilung n -> \inf
Schüler unabhängig? Geschwister, Freundschaften, Beziehungen untereinander, vl starke Abhängigkeiten Im Bericht erklären warum wir das annehmen Wissen keine Hintergründe der Teilnehmer, verinfachende Annahme Ergebnisse mit Vorsicht genießen
Multiple Hypothesentests hier nicht nötig bzw. irrelevant Sollten wir aber im Bericht erwähnen hat lunch einfluss auf leistung als überhypothese gesamthypothese in drei unterhypothesen aufteilen dann testniveau anpassen, weil wir das nicht machen müssen wir hier nichts anpassen
Wenn wir uns für ein Skalenniveau entschieden haben, mit Begründung: Müssen nur die Methoden verwenden und vorstellen, die für uns wichtig sind.
Wenn es Bindungen im Datensatz gibt (die wir wahrscheinlich wohl leider doch haben) kann es gar nicht t test geben :((((((((((((
Wilcoxon Rangtest, Verteilungsfunktion nicht stetig, wenn wir runden quasistetig weil 101 Ausprägungen,
Vielleicht doch ein T test wenn wir das genau begründen nur ein Satz reicht nicht Vortests sollen die Begründung unterstützen Begründung, dann kommt nur die und die Methode in Frage
Normalverteilung als Approximation verwenden, aber man muss erklären wie sich das auf die Daten auswirkt
Frage: Hat keinen Einfluss auf das Testergebnis wenn wir die Normalverteilung als Approximation verwenden
Shapiro Wilk Test none und math: P-Wert sehr klein im Vergleich zu den anderen geringer Stichprobenumfang -> Power/beta Fehler extrem groß möglicherweise Indiz dafür dass man nicht einfach nur Normalverteilung für gesamten Datensatz annehmen kann. Robustere Variante vl eher zielführend. Daten für diesen Fall anschauen, wieso Anzeichen für keine Normalverteilung?
Lagevergleiche Zweistichproben t-Test stochastisch unabhängig genau beschreiben Definieren also auf Unabhängigkeit innerhalb und zwischen den Gruppen eingehen
Wilcoxon Rangsummentest
keine explizite Verteilungsannahme zur Durchführung, aber die Verteilung muss stetig sein, (basti sagt sie müssen die selbe Gestalt haben, Tim J sagt beim lokationsproblem ist das so, irgendwas mit delta, aber im Spezialfall ginge das, da dürfen sich die Verteilungen sich nicht schneiden, also doch gleiche Varianzen(?) laut karsten) Irgendwas von wegen selber Test mit selber Teststatistik. Man muss aufpassen und genau betrachten was wirklich getestet wird, was ist mit Vergleichbarkeit gemeint, Bartlett Test als Vortest spielt eine Rolle.
Was ist Algebraische Gleichheit? Was bedeutet das? Steht im Hartung laut Tim J. War wohl nur ein fun fact Annahmen des U-Tests angeben? Kolgomornov Smirnoff Test? Zum Test auf gleiche Verteilung
Was nehmen wir mit?
Exakte oder asymptotische Verteilung? w Konvergenz in Verteilung bei letztem Bsp.
Intuition zu den einzelnen Tests ?!?!?!?!? was meint er?
Wilcoxon Rangsummentest berechnet Rangsumme nur über die eine Stichprobe.
Bei Bindungen verändert sich der Stichprobenumfang beim Wilcoxon Rangsummentest irgendwas mit N1 + N2 + 1 Anzahl der Bindungen angeben!!!!!
Lehrbuch lesen
wenn man schon weiß Varianzen sind gleich, natülich gibt es noch Schiefe und Wölbung ks test kann man für Normalverteilungsvortest und Verteilungsgleichheit verwenden
Stetigkeit muss diskutiert werden
S.134 im Brüning wenn es nicht stetig ist
bindungen in der Stichprobe -> Mann Whitney U Test
skalenniveau -> nomina, ordinal kardinal
begründen, warum Noten kardinal (kann man die Verhältnisse interpretieren?)