Treniranje agenta u što kraćem vremenskom periodu da se kreće optimalno po nepoznatom okruženju. Za Flappy BIrd, agent je ptica čije su moguće akcije da uradi ništa ili skoči i čije je trenutno stanje definisano sa: odstojanje od sledećih prepreka i odstojanje od dna prepreke. Svakim pokretanjem aplikacije generišu se prepreke sa otvorima na različitim visinama kroz koje agent prolazi kako bi ostvario što veći rezultat. Agent će biti implementiran uz pomoć dva algoritma čije će se performanse porediti.
Algoritmi:
NEAT evolutivni algoritam baziran na neuronskim mrežama
Deep Q-Learning algoritam
Metrika za merenje performansi:
Vreme potrebno za treniranje agenta i rezultat na kraju igre.
Validacija rešenja:
Posmatranjem broja uspešno pređenih nasumično generisanih prepreka i poređenjem sa random agentom.
Članovi tima:
Asistent:
Problem koji se rešava:
Algoritmi:
Metrika za merenje performansi:
Validacija rešenja: