michael-spengler / aktuelle-data-science-entwicklungen-2-wwi19dsab

3 stars 6 forks source link

Reinforcement Learning for Games #15

Open stefaneckerle opened 2 years ago

stefaneckerle commented 2 years ago

Niklas Lederer Ferdinand Bubeck Johannes Bubeck Stefan Eckerle

Ausgesuchtes Spiel ist Flappy Bird

stefaneckerle commented 2 years ago

Der Code sowie die Präsentation befindet sich in folgendem Repo: https://github.com/stefaneckerle/FlappyBird_Abgabe

michael-spengler commented 2 years ago

Feedback zur Präsentation

Historische Betrachtung Schach, Go, ... top (--> häufig ist es super zu verstehen wie etwas ist, indem wir verstehen wie es so geworden ist)
Spannende Use Cases (Alpha Fold...) beschrieben... zusätzlich spannend ... https://openai.com/ --> stichwort zentralisierung der skills / unfair advantages...
Gute Gegenüberstellung (algorithmisch vs. Q-Learning)
Am Belohnungssystem kann optimiert werden
Modellbasierte Ansätze fördern scheinbar die Entstehung von Oligopolen & Monopolen --> unfair advantages

Anregungen: Zusammenfassung einfügen wann genau empfiehlt sich welche Vorgehensweise? Contributor ermutigen die Forschung aufzugreifen / weiterzuführen...

Tendenz: <= 1,3

fbubeck commented 2 years ago

Repo + Präsi wurde entsprechend der Anregungen nochmals angepasst

https://github.com/stefaneckerle/FlappyBird_Abgabe/blob/master/README.md