Open zerry82 opened 6 years ago
소스 : reinforcement-learning-kr/1-grid-world/1-policy-iteration/environment.py
12:POSSIBLE_ACTIONS = [0, 1, 2, 3] # 상, 하, 좌, 우
위 주석에서 [상,하,좌,우] -> [좌,우,상,하] 로 되어야 할듯 합니다~
environment.py 코드에서 실제 에이전트가 움직일 때는 상하좌우인데 POSSIBLE_ACTIONS라는 변수가 잘못 정의되어 있네요; 수정하겠습니다!
소스 : reinforcement-learning-kr/1-grid-world/1-policy-iteration/environment.py
12:POSSIBLE_ACTIONS = [0, 1, 2, 3] # 상, 하, 좌, 우
위 주석에서 [상,하,좌,우] -> [좌,우,상,하] 로 되어야 할듯 합니다~