29-75 / running-car

머신러닝을 기반으로 장애물을 피해 달리는 자동차를 만들어보자
0 stars 3 forks source link

Running car를 개발하기 위한 참고 가능한 자료를 모아보자 #7

Open gon-park opened 4 years ago

gon-park commented 4 years ago

https://www.youtube.com/watch?v=wL7tSgUpy8w

sungwon-ahn commented 4 years ago

1.https://youtu.be/Aut32pR5PQA ( Deep Learning Cars )

gon-park commented 4 years ago

https://www.youtube.com/watch?v=r428O_CMcpI

mbj0528 commented 4 years ago

https://www.youtube.com/watch?v=BhsgLeY_Q-Y

mbj0528 commented 4 years ago

가속 감속 방향 있는 코드 pygame http://rmgi.blog/pygame-2d-car-tutorial.html

mbj0528 commented 4 years ago

오브젝트 x 픽셀로 해보자.

mbj0528 commented 3 years ago

강화학습 알고리즘 중 하나인 Deep Q-learning 사용하는 뱀게임 상세설명 링크

gon-park commented 3 years ago

Explained : Neural network

https://www.youtube.com/watch?v=rEDzUT3ymw4

자동차 주행에 대해 Neural network 구축 예시

Input & Output

image

Layer

image

gon-park commented 3 years ago

Neural Network & Genetic Algorithm 통합 사례

https://www.youtube.com/watch?v=aeWmdojEJf0

Neural Network 적용 방법

image

Genetic Algorithm 적용 방법

image

mbj0528 commented 3 years ago

cartpole DQN 예제

링크

Agent : keras models의 Sequential 을 사용하여 구현

현재 상태에 대한 모델의 큐함수

다음 상태에 대한 타깃 모델의 큐함수

각 에피소드 마다 타깃 모델을 모델의 가중치로 업데이트

목표 점수 달성시 학습 중단

image

우리 Running Car에 어떻게 적용?

강화학습

image

Episode 단위가 generation 이고 한번에 하나의 차라고 고려.

현재 상태에 기반해 다음 타임 스텝 수행 -> 강화

Episode가 끝날때 마다 보상

매 타임 스텝마다 학습하고 메모리에 저장. 이것은 다시 학습할 때 무작위로 꺼내서 쓰는 용도.

액션을 정할때 입실론 탐욕 정책 -> 입실론 탐욕정책이 무엇인가?

jeonhyunji commented 3 years ago
gon-park commented 3 years ago

https://frhyme.github.io/python-lib/keras-nn/