Open gon-park opened 4 years ago
1.https://youtu.be/Aut32pR5PQA ( Deep Learning Cars )
가속 감속 방향 있는 코드 pygame http://rmgi.blog/pygame-2d-car-tutorial.html
오브젝트 x 픽셀로 해보자.
강화학습 알고리즘 중 하나인 Deep Q-learning 사용하는 뱀게임 상세설명 링크
https://www.youtube.com/watch?v=rEDzUT3ymw4
https://www.youtube.com/watch?v=aeWmdojEJf0
cartpole DQN 예제
Agent : keras models의 Sequential 을 사용하여 구현
현재 상태에 대한 모델의 큐함수
다음 상태에 대한 타깃 모델의 큐함수
각 에피소드 마다 타깃 모델을 모델의 가중치로 업데이트
목표 점수 달성시 학습 중단
우리 Running Car에 어떻게 적용?
강화학습
Episode 단위가 generation 이고 한번에 하나의 차라고 고려.
현재 상태에 기반해 다음 타임 스텝 수행 -> 강화
Episode가 끝날때 마다 보상
매 타임 스텝마다 학습하고 메모리에 저장. 이것은 다시 학습할 때 무작위로 꺼내서 쓰는 용도.
액션을 정할때 입실론 탐욕 정책 -> 입실론 탐욕정책이 무엇인가?
Deep Reinforcement Learning (NeuralNetworks + Q-Learning) 사용한 snake game
DQN 사용해서 만든 자율주행 car
강화학습 대표적인 알고리즘 설명 (Q-learning, DQN, A3C)
https://www.youtube.com/watch?v=wL7tSgUpy8w