anadiedrichs / drone-deep-rl

Personal repository with experimental code
Apache License 2.0
3 stars 0 forks source link

measure performance in problem 1 #4

Open anadiedrichs opened 6 months ago

anadiedrichs commented 6 months ago

Luego de la reunión de hoy con Olmer, me sugirió simplificar la función de recompensa como una función escalonada o binaria. Por ejemplo: regresar 1 cuando se acerque a una esquina (unos 30 cm de distancia), 0 lo contrario.