Open JRichi99 opened 1 year ago
Hola @JRichi99! Es solo un mapa y es el entregado. Si se puede hacer lo que mencionas, pero obtendrías similares resultados utilizando Q-Learning con suficientes iteraciones, ya que se va propagando la recompensa negativa desde el callejon. Espero que te sirva y buen fin de semestre!
Hola buenas, Mi consulta es si tenemos solamente un mapa o si estos se generan de forma aleatoria? En caso de que tengamos un solo mapa podemos generar un hardcode a partir de este. Por ejemplo: Evitar las casillas (i,j) o (l,h) porque son callejones sin salida Un saludo