Closed TB2715 closed 2 years ago
제가 지금까지 찾은 내용을 정리합니다. (논문..읽어보려다 55페이지인거 보고 구글 검색으로 도망쳤습니다..)
CBOW와 Skip-gram 모델에서 사용하는 비용 계산 알고리즘
전체 데이터셋에 대해 softmax 함수를 적용하는 것이 아닌, 샘플링으로 추출한 일부에 대해서만 적용하는 방법
일반적으로 단어 개수가 많을 때 사용하고, NCE를 사용할 경우 문제를 (실제 분포에서 얻은 샘플)과 (인공적으로 만든 답음 분포에서 얻은 샘플)을 구별하는 이진 분류 문제로 바꿀 수 있음
혹시 제가 잘못 작성했거나, 추가로 아시는 사항 있으시다면 추가 작성 부탁드립니다!
현지님 제가 논문을 아직 읽지도 못했곸ㅋㅋㅋ그래서 이슈만 봤는데.. relational extraction 찾아보니까 또 저 워딩이 나오네요. 설명해주셨듯 단어 갯수가 많을 때 뭔가 샘플링이 필요할 때 쓰는 방식인가보네요
아아 논문 읽고 다시보니까 좀더 이해가 되는데 아래 부분이 이해가 안돼서 고민해봐야할 것 같아요 ㅠ
일반적으로 단어 개수가 많을 때 사용하고, NCE를 사용할 경우 문제를 (실제 분포에서 얻은 샘플)과 (인공적으로 만든 답음 분포에서 얻은 샘플)을 구별하는 이진 분류 문제로 바꿀 수 있음
http://incredible.ai/nlp/2017/11/25/Word2Vec-Noise-Constrastive-Estimation/ 해당 링크가 설명을 좀 자세히 해둔 것 같습니다! 저도 아직 제대로 못 읽어보긴 했는데..ㅠㅜ 읽고 이해되면 추가 댓글 달겠습니다..!
오호 수식파티네용;D 공유 감사합니답 수정님
라고 Noise Contrastive Estimation(NCE) 개념이 등장합니다. NCE란 어떤 개념일까요?