Hola :)
De la materia entiendo que mi QTable debe ser de NxM con N el número de estados posibles y M el número de acciones posibles.
Sin embargo, hablando de la tarea, a la hora de convertir esto a código me surge el problema que no sé como definir que una fila de mi Qtable se corresponde a cada state[0], ... , state[4].
Se me ocurre crear una función que a partir de una combinación de estados (state[0], ..., state[4]), entregue una fila {0, ..., N}.
Se espera que abordemos este problema así o estoy mal?
Hola :) De la materia entiendo que mi QTable debe ser de NxM con N el número de estados posibles y M el número de acciones posibles. Sin embargo, hablando de la tarea, a la hora de convertir esto a código me surge el problema que no sé como definir que una fila de mi Qtable se corresponde a cada state[0], ... , state[4]. Se me ocurre crear una función que a partir de una combinación de estados (state[0], ..., state[4]), entregue una fila {0, ..., N}. Se espera que abordemos este problema así o estoy mal?
Saludos 🤠