rlcode / reinforcement-learning-kr

[파이썬과 케라스로 배우는 강화학습] 예제

MIT License

371 stars 228 forks source link

p. 108 벨만 기대 방정식과 벨만 최적 방정식 #18

Open jihobak opened 6 years ago

jihobak commented 6 years ago

정리 > 다이내믹 프로그래밍과 그리드월드

단락에서 '벨만 기대 방정식을 이용한 것은 정책 이터레이션이며, 벨만 최적 방정식을 이용한 것이 정책 이터레이션입니다.' --> '벨만 기대 방정식을 이용한 것은 정책 이터레이션이며, 벨만 최적 방정식을 이용한 것이 가치 이터레이션입니다.

으로 바뀌어야 할 것 같습니다만 맞나요?

17 와 마찬가지로 일단은 오탈자로 등록 해보겠습니다.

감사합니다.

dnddnjs commented 5 years ago

오탈자 알려주셔서 감사합니다! 수정해서 반영하도록 하겠습니다