FOM-ifes / VL-Fallstudien

0 stars 2 forks source link

Ein erster Aufschlag für 6_clusteranalyse #2

Closed statistical-thinking closed 6 months ago

statistical-thinking commented 6 months ago

Hallo zusammen,

anbei ein erster Aufschlag für 6_Clusteranalys zur freien Verfügung und natürlich offen für Verbesserungen etc.

Beste Grüße aus dem heute sonnigen Bonn Dennis

NMarkgraf commented 6 months ago

Ich würde dieses PR gerne zurückweisen!

"\newpage" gehört nicht in ein quarto Dokument! Dort gibt es "{{< pagebreak >}}" statt dessen! Ausserdem arbeitet die Fallstudie nicht mit Mosaic. Z.B. "subset(...)" statt ".. |> filter()...) ->" etc.

Nach Änderung gerne.

Gruß Norman

statistical-thinking commented 6 months ago

Korrekt :-) Bianca hatte mich nach erster Durchsicht gebeten den PR schon zu platzieren, um genau dieses Feedback im Sinne der ifes Standards für die weitere Bearbeitung mitnehmen zu können.

statistical-thinking commented 6 months ago

Ein bisschen konnte ich bereits an der mosaic Umstellung arbeiten...

luebby commented 6 months ago

Lieber @statistical-thinking ,

zunächst einmal vielen Dank! Vieles gefällt mir:

(Ich finde auch hier hat Allison Horst schöne Erklärungen: https://allisonhorst.com/k-means-clustering)

Und es ist natürlich gut, wenn die Studierenden unterschiedliche Stile kennenlernen.

Ein wenig schwer tue ich mich mit den historisch sicherlich bedeutsamen, und auch von mir früher genutzten iris Datensatz. Einerseits ist Fisher in mehrer Hinsicht problematisch (siehe z.B. https://doi.org/10.1038/s41437-020-00394-6), daher verwenden viele mittlerweile eigentlich die unkritischen, und ebenfalls niedlichen palmerpenguins als Alternative, und andererseits haben die Daten eher wenig Bezug zu den Studieninhalten unser Studierenden.

Natürlich kann man eingebaute Datensätze über data(...) in der Lehre nutzen, aber zumindest meine Studierenden fragten dann immer nach dem Praxisbezug (Thesis, Arbeit), wo sie i.d.R. keine R-internen Daten nutzen. Dank Projektstruktur und library(here) ist es in meiner Wahrnehmung auch keine große Hürde mehr eigene Daten einzulesen. (Früher hat das mehr Probleme als Lernergebnis gebracht.)

Was sind Deine/ Eure Erfahrungen und Meinungen dazu?

P.S. Reine Neugier: Warum startest Du nicht mit 1 für i in for (i in 1:10) wcss[i]? P.P.S. Wäre eine Formel für den WCSS Wert nicht auch schön? P.P.S. Warum überhaupt {{< pagebreak >}}?

statistical-thinking commented 6 months ago

Ich glaube, meinen vorherigen Kommentar habe ich nicht abgesendet (vermutlich das WLAN im ICE):

Vielen Dank für Euer schnelles Feedback! Updates sind schon vorgenommen.

Ursprünglich hatte ich einen optisch nicht ganz zufriedenstellenden plot(...) für die wcss von 1:10, weshalb ich daraus 2:10 ohne Beeinflussung des Ergebnisses gemacht habe. Dies ist seit der Umstellung auf mosaic und gf_line aber scheinbar kein Problem mehr :-)

Die Seitenumbrüche hatte ich eingefügt, damit im PDF zu jedem Fließtext der dazugehörige Code bzw. Output auf einer Seite erscheint. Durch die Überarbeitung sind es bereits weniger geworden.

Bleibt nur die Frage ob IRIS, PINGUINE oder ein anderer Datensatz. Ich bin da flexibel, denke aber, dass man den Studierenden den Übertrag vom Allgemeinen zum Besonderen (bspw. Marktsegmentanalyse) aber auch als kleine Denkaufgabe überlassen könnte... gebt mir einfach eine offizielle Vorgabe die für das ifes okay ist und ich setze diese um.

Weitere Anmerkungen meinerseits im Update :-)

luebby commented 6 months ago

Thema Seitenumbrüche: Da wir interaktiv an den Fallstudien arbeiten und die Studierende Lösungen usw. ergänzen ändert sich das eh'.

Ich glaube ob data() und ob iris (hier übrigens ein altes Beispiel von mir - auch noch ohne kritischen Kommentar, Schande über mich) ist diskutabel. Ich mache es anders, ändere aber auch gerne meine Meinung bzw. bin da eher emotionslos.

statistical-thinking commented 6 months ago

Emotionslos ist sehr gut, Auswahl aber auch: Soeben die letzten Eurer Anmerkungen im IRIS Beispiel umgesetzt und um die gleiche Fallstudie mit PENGUINS ergänzt :-)

Außerdem haben Studierende so die mögliche Zusatzaufgabe, die IRIS / PENGUINS Analyseschritte vice versa zu reproduzieren.

luebby commented 6 months ago

Besten Dank @statistical-thinking