Problem koji se rešava:
Simulacija robota u skladištu koji treba da prenese (guranjem) odgovarajuće pakete sa mape
do lokacije označene na mapi. Prostor stanja je kontinualan, a robot može
da se kreće gore, dole, levo, desno. Na mapi se mogu nalaziti i druge stvari koje robot
treba da preskoči, to jest da ne prenese do ciljne lokacije.
Algoritam: deep q network (DQN), ili neki drugi reinforcement learning algoritam.
Metrika za merenje performansi:
Srednja kvadratna greška izmađu novih q vrednosti i predviđenih q vrednosti.
Validacija rešenja: Ako robot na smislen način posle kraćeg vremena prebaci
pakete (samo one koje treba) na željenu lokaciju onda je rešenje validno.
Ivan Partalo, RA 126/2020, 5. grupa
Asistent: Filip Volarić
Problem koji se rešava: Simulacija robota u skladištu koji treba da prenese (guranjem) odgovarajuće pakete sa mape do lokacije označene na mapi. Prostor stanja je kontinualan, a robot može da se kreće gore, dole, levo, desno. Na mapi se mogu nalaziti i druge stvari koje robot treba da preskoči, to jest da ne prenese do ciljne lokacije.
Algoritam: deep q network (DQN), ili neki drugi reinforcement learning algoritam.
Metrika za merenje performansi: Srednja kvadratna greška izmađu novih q vrednosti i predviđenih q vrednosti.
Validacija rešenja: Ako robot na smislen način posle kraćeg vremena prebaci pakete (samo one koje treba) na željenu lokaciju onda je rešenje validno.