Closed eubinecto closed 4 years ago
DNN으로는 fixed-sized vector만 입력과 출력으로 사용할 수 있으나, RNN으로는 sequences of vectors를 모델링할 수 있다.
입력 벡터의 조합에서 패턴을 찾는 것이 아닌, 입력 벡터의 나열에서 패턴을 찾을 수 있도록 해준다.
과거에 존재하는 패턴으로 부터 미래를 예측한다.
그림으로 이해하는 것이 가장 빠를듯. -Chapter 4. Recurrent Neural Networks
Perceptron | recurrent neuron |
---|---|
... |
한가지 매우 중요한 차이점.
Recurrent neuron 의 경우 매우 중요한 점:
모든 time frame에 대하여 사용하는 가중치 행렬이 동일하다. 하나의 뉴런으로 모든 시간대의 패턴을 학습한다.
hidden state: "short-term memory"
activation f = logistic 인 경우, 각 time frame 마다 조건부 확률이 존재하는 것으로도 이해할 수 있음.
p(pos|memory_t-1,in_t ), p(pos|p(pos|memory_t-1, in_t), in_t+1), and so on
perceptron layer | recurrent layer |
---|---|
... |
왜 RNN을 쓰는가?
RNN의 적용 예시
RNN: intuition
RNN의 최소단위: recurrent neuron
왜 같은 weight through time?
단기기억의 capacity를 늘리기 위해: recurrent layer
RNN의 사용방법
수학적으로 정의해보기
code로 재확인