ob-algdatii-ss18 / leistungsnachweis-firststeptoworlddomination

leistungsnachweis-firststeptoworlddomination created by GitHub Classroom
0 stars 0 forks source link

Themenbeschreibung #1

Open raharth opened 6 years ago

raharth commented 6 years ago

Implementieren eines einfachen Q-Learning Algorithmus, der aus Interaktion mit einer Umgebung lernt.

Im ersten Schritt implementieren wir ein diskretes deterministisches Modell in einer statischen Umgebung. Das Modell soll dann in einem zweiten Schritt auf eine stochastische Umgebung erweitert werden und falls der Umfang des Projekts das zu lässt in einem weiteren Schritt auf eine dynamische Umgebung angepasst werden.