Closed Shindav closed 1 year ago
꼬맨틀 페이지의 질문 및 답변 항목을 참고해주세요.
Q. 왜 유사도가 제가 예상한 값과 많이 다른가요?
A. 몇가지 이유가 있습니다.
- 단어가 하나 이상의 의미를 가지는 경우가 있을 수 있습니다. 이 경우, 하나의 의미가 다른 하나의 의미 보다 더 자주 사용되는 경우도 있습니다. (예시: 배)
- 다른 품사로 더 많이 사용되는 단어일 수 있습니다. (예시: 꾸다-꿈)
- 이 게임에서의 "유사도"를 더 정확하게 설명하면 "유사한 맥락에서 사용됨"을 의미합니다. 따라서 "사랑"과 "미움"은 반대되는 것처럼 보일 수 있지만 종종 비슷한 점수를 받습니다. "사랑"의 실제 반대는 아마도 "화강암" 또는 "기화기"와 같은 것일 것입니다.
- 유사도 추정은 훈련된 데이터에 따라 편향되어 있을 수 있습니다. 꼬맨틀에서는 Common Crawl 및 Wikipedia 데이터로 사전 훈련된 FastText를 사용합니다.
도저히 이해가 안되는데 정확한 설명 부탁드립니다