ftn-ai-lab / ori-2022-siit

0 stars 0 forks source link

Lunar Lander Game #12

Open banzg00 opened 2 years ago

banzg00 commented 2 years ago

Članovi tima: Bane Gerić SW47/2019 (grupa 4)

Asistent: Branislav Anđelić

Problem koji se rešava: Implementacija agenta za Lunar Lander igru u programskom jeziku Python. Cilj igre je da se agent uspješno spusti na označeni dio, a da se pri tome ne slupa.

Algoritmi: Koristiće se algoritam DQN.

Metrika za merenje performansi: Cilj je da agent maksimizuje nagrade od reward funkcije koja gleda koliko efikasno je sletio.

Validacija rešenja: Uzima se srednja vrijednost reward funckije nakon 1000 pokušaja agenta da se spusti. Zatim se promjenom podešavanja novi agent testira u narednih 1000 pokušaja i onda se njegova srednja vrijednost poredi sa prethodnom.

bandjeo commented 2 years ago

Tema odobrena. Ostavite link ka GitHub repozitorijumu projekta. Srećan rad.

banzg00 commented 2 years ago

Link ka repozitorijumu: https://github.com/banzg00/Lunar-lander-with-DQN