rlcode / reinforcement-learning-kr

[파이썬과 케라스로 배우는 강화학습] 예제
MIT License
371 stars 228 forks source link

Q-learning epsilon parameter for Epsilon-greedy action selection #56

Open rrbb014 opened 3 years ago

rrbb014 commented 3 years ago

1-grid-world/5-q-learning/q_learning_agent.py 에서 epsilon이 0.9로 설정되어 random action 을 자주 하게됩니다.