Open anadiedrichs opened 6 months ago
Luego de la reunión de hoy con Olmer, me sugirió simplificar la función de recompensa como una función escalonada o binaria. Por ejemplo: regresar 1 cuando se acerque a una esquina (unos 30 cm de distancia), 0 lo contrario.
Luego de la reunión de hoy con Olmer, me sugirió simplificar la función de recompensa como una función escalonada o binaria. Por ejemplo: regresar 1 cuando se acerque a una esquina (unos 30 cm de distancia), 0 lo contrario.