Word2Vec 논문 2페이지에 보면
We use recently proposed techniques for measuring the quality of the resulting vector representations, with the expectation that not only will similar words tend to be close to each other, but that words can have multiple degrees of similarity [20]
라는 부분이 나옵니다.
단어 유사성을 이해하는 것이 목적이라는 것은 알겠는데 multiple degrees of similarity가 무슨 의미인지 잘 이해가 되지 않습니다.
아래 예시와 같은 생각으로 일단 이해하고 넘어갔는데, 정확한 의미에 대해 알고 싶어서 질문합니다.
( Korea는 Seoul과 Similarity를 가지고 있음과 동시에, Kimchi와도 Similarity를 가지고 있으니 multiple degreses of similarity를 가지고 있는건가? 라고 일단은 이해하고 넘어갔습니다)
같은 noun이어도 형태의 차이(e.g단수/복수)를 가져도 비슷한 표현으로 볼 수 있는 것e.g, apple, apples
한 개의 단어가 여러개의 비슷한 성격을 가지는 단어와도 연결될 수 있는 것(e.g, 성별, 직위) -> figure2 에서 왼쪽은 각 단어가 1:1매핑(man->woman, king->queen), 반면 오른쪽 그림은 1개의 단어가 여러개와 연결(king-> kings & king->queen)
그리고 본 논문에서도 결과 섹션에서 big-bigger-biggest 라는 예를 들었는데요. 마찬가지로 한개의 단어가 여러개의 비슷한 의미 특성을 가진 단어와도 연결될 수 있는 의미라고 이해했어요.
Word2Vec 논문 2페이지에 보면 We use recently proposed techniques for measuring the quality of the resulting vector representations, with the expectation that not only will similar words tend to be close to each other, but that words can have multiple degrees of similarity [20] 라는 부분이 나옵니다. 단어 유사성을 이해하는 것이 목적이라는 것은 알겠는데 multiple degrees of similarity가 무슨 의미인지 잘 이해가 되지 않습니다. 아래 예시와 같은 생각으로 일단 이해하고 넘어갔는데, 정확한 의미에 대해 알고 싶어서 질문합니다.
( Korea는 Seoul과 Similarity를 가지고 있음과 동시에, Kimchi와도 Similarity를 가지고 있으니 multiple degreses of similarity를 가지고 있는건가? 라고 일단은 이해하고 넘어갔습니다)