anadiedrichs / drone-deep-rl

Apache License 2.0
2 stars 0 forks source link

measure performance in problem 1 #4

Open anadiedrichs opened 2 months ago

anadiedrichs commented 2 months ago

Luego de la reunión de hoy con Olmer, me sugirió simplificar la función de recompensa como una función escalonada o binaria. Por ejemplo: regresar 1 cuando se acerque a una esquina (unos 30 cm de distancia), 0 lo contrario.