SSUHan / PaparReviews

8 stars 2 forks source link

[18.11.26] Word2vec을 활용한 RNN 기반의 문서 분류에 관한 연구 #4

Open strutive07 opened 5 years ago

strutive07 commented 5 years ago

Word2vec을 활용한 RNN 기반의 문서 분류에 관한 연구

h_t의 활성화는 현재 입력 와 이전 hidden layer 상태의 의 activation function 으로 계산이 되며, 마지막 순간의 출력은 시퀀스에 대한 전체 표현이 된다.

image

마지막 예측 층은 Softmax를 사용한다. image

n은 마지막 output layer 의 뉴런 수. 분모는 입력된 전체 시퀀스 벡터의 지수 함수, 분자는 입력된 시퀀스 벡터 의 지수함수 다.

cost 함수는 cross-entropy 방식을 사용하였다. 예측 값 에 로그를 취한 것과 실제 값 의 곱을 전부 합하여 class의 개수 만큼 나눈 값으로, 목표는 예측 값 와 실제 값 의 확률 분포차이를 구하는 식이다 image

[image:EDD7EC68-47AB-496D-BF1B-75DC08E7605C-320-0000A3AE6241D303/56CC6514-8901-4C91-9D81-0EC3FD9EA943.png] image

Dataset

Valuable Relative Works

SSUHan commented 5 years ago

Questions