Issues of vanishing gradient with dueling network

joon0503 / smartCampus

Files for reinforced learning of vehicle

1 stars 1 forks source link

Closed joon0503 closed 5 years ago

joon0503 commented 5 years ago

From the simulation, it seems when dueling network is used agent learns faster.

However, after ~5000episodes output value of the network converges to 0, and gradient vanishes.