Lunar lander je stara igrica u kojoj je cilj da nasa raketa napravi sigurno sletanje na obelezenu zonu, postoji nekoliko verzija ove igrice, ovde ce biti implementirana najlaksa, raketa ce biti generisana negde na mapi a nas agent ce morati da sigurno sleti. Akcije koje agent ima su paljenje levog motora koji gura raketu na levo, paljenje desnog motora koji gura raketu na desno i paljenje donjeg motora koji usporava raketu, takodje raketa se rotira pa se mora paziti i da se ne prevrne.
Algoritam
Deep Q learning algoritam
Metrika za merenje performansi
Broj epizoda koje su agentu bile potrebne da bi naucio da sleti
Članovi tima
Miloš Stanojlović SV76-2020 grupa 5
Asistent
Filip Vularić
Problem koji se resava
Lunar lander je stara igrica u kojoj je cilj da nasa raketa napravi sigurno sletanje na obelezenu zonu, postoji nekoliko verzija ove igrice, ovde ce biti implementirana najlaksa, raketa ce biti generisana negde na mapi a nas agent ce morati da sigurno sleti. Akcije koje agent ima su paljenje levog motora koji gura raketu na levo, paljenje desnog motora koji gura raketu na desno i paljenje donjeg motora koji usporava raketu, takodje raketa se rotira pa se mora paziti i da se ne prevrne.
Algoritam
Deep Q learning algoritam
Metrika za merenje performansi
Broj epizoda koje su agentu bile potrebne da bi naucio da sleti
Validacija rešenja
Vizualni prikaz agetna koji sleće