Sistem podrške odlučivanju upravljanja vozilom u saobraćajnim gužvama. Treniranje agenta da samostalno menja trake na osnovu vozila u njegovoj okolini u 2D okruženju.
Okruženje se nalazi na linku.
Algoritam
Učenje nadgledanjem (eng. supervised learning) - Multilayer Perceptron (MLP) algoritmom propagacije unazad pomoću gradijentne metode
Učenje uslovljavanjem (eng. reinforcement learning)
Podaci koji se koriste:
Učenje nadgledanjem (eng. supervised learning) - ručno prikupljeni podaci vožnje iz okruženja
Učenje uslovljavanjem (eng. reinforcement learning) - podaci u realnom vremenu tokom vožnje
Metrika za merenje performansi
Učenje nadgledanjem (eng. supervised learning) - Procenat tačnosti "ispravnih" odluka i prosečna brzina vožnje nakon 10 min.
Učenje uslovljavanjem (eng. reinforcement learning) - Prosečna brzina vožnje nakon 10 min.
Članovi tima
Luka Bjelica SW21-2018 2. grupa
Asistent
Lukić Aleksandar
Problem koji se rešava
Sistem podrške odlučivanju upravljanja vozilom u saobraćajnim gužvama. Treniranje agenta da samostalno menja trake na osnovu vozila u njegovoj okolini u 2D okruženju. Okruženje se nalazi na linku.
Algoritam
Podaci koji se koriste:
Metrika za merenje performansi
https://github.com/bjelicaluka/self-driving-rl