Closed CoodingPenguin closed 3 years ago
실습에 나온 Bidirectional GRU 을 기반으로 설명드립니다! ( 실습엔 GRU로 되어있습니다)
입력은 몇 개가 들어가는지
출력은 몇 개가 나오는지
Layer는 몇 개가 필요한지
@jjerry-k 질문이 많이 모호했군요. 죄송합니다ㅠㅠ
양방향 GRU/LSTM 모델에서 궁금했던 점을 정리하면 다음과 같습니다.
return
이 맞습니다!http://intelligence.korea.ac.kr/members/wschoi/nlp/deeplearning/Bidirectional-RNN-and-LSTM/
위의 자료를 참고하여 대답을 생각해보았는데요.
이렇게 생각했습니다!
근데 지금 와서 조금 궁금한 점이 이렇게 양방향으로 했을 때 왜 성능이 조금 더 잘 나오는지 궁금합니다. 단순히 역전된 형태의 입력으로 받는 모델을 생성하는 것 뿐인데 어떠한 이유로 성능이 잘 나오는 것인지 궁금합니다!
이건 양방향으로 볼 필요가 있는 task 냐 아니냐를 따져보면 될 것 같습니다!
예를 들면 번역 문제가 될 수도 있겠네요!
I am a student 라는 문장이 있으면 단방향의 경우엔 I, am, a, student 라고 학습할텐데요.
양방향이라면 I, am, a, student. student, a, am, I 이렇게 두번 입력을 받는 것이죠!
단순히 생각해보면 I와 student의 관계를 양방향으로 학습할 수 있다 라고 생각하시면 될 것 같습니다!
@jjerry-k 생각해보니 번역 문제가 그렇겠네요. 번역 문제의 경우 기존 단방향 RNN기반 모델에서는 오직 이전의 정보만 사용해서 번역을 하는데 사실 제가 번역을 해보면 단순히 앞의 정보뿐 아니라 뒤의 정보도 필요하니까요. 그 때는 단방향보다 양방향이 더 효과가 있을 것 같습니다!
답변 감사드립니다!
🙌 질문자
펭귄
@CoodingPenguin❓ 질문 내용