Closed subinium closed 3 years ago
Contextualized Word Embedding
biLM(Bidirectional Language Model)
문맥을 이해해야 하므로 입력은 word 단위가 아닌 sequence 단위
학습 과정은 기존 LM과 유사하게 앞의 N개 단어를 사용했을 때 N+1번째 단어를 학습하는 방식
CNN을 사용하여 context-independent token을 만듬
Jaemin Cho : Deep Learning for Chatbot (2/4)에 다양한 Character-based CNN 설명이 되어 있음.