ratsgo / embedding

한국어 임베딩 (Sentence Embeddings Using Korean Corpora)
https://ratsgo.github.io/embedding
MIT License
452 stars 129 forks source link

page 98. 표 3-3 오타 #46

Closed hccho2 closed 4 years ago

hccho2 commented 4 years ago

page: 98 Kkma형태소 분석 결과와 Mecb 분석 결과에 오타가 있습니다.

Kkma에 '에/JKM' ---> '들어가/VV' Mecab에 '가/JKS'가 2번 나옵니다. '방'으로 수정 필요.

=================== page 168 코드 4-46에 정의된 ----> 코드 4-47에 정의된

=================== page 170 코드 4-51에서 --embedding_corpus_path 로 'corpus_mecab.txt'를 넣어주고 있는데, corpus_mecab.txt라는 파일은 없는 것 같습니다. 흐름상으로는 네이버 영화 리뷰 말뭉치가 들어가야 되니, 'ratings_mecab.txt'이 되어야 하지 않을까요?

=================== page 184 w_0, w1, ..., w{T-1}이기 때문에, 수식 5-1에서 \Sigma{t=k}^{T-k} ===> \Sigma{t=k}^{T-1} 이렇게 수정되어야 될 것 같습니다.

=================== page 187 코드 5-11에서 'Togged Document' ---> 'TaggedDocument'

from gensim.models.doc2vec import Togged Document ==> from gensim.models.doc2vec import TaggedDocument

ratsgo commented 4 years ago

@hccho2 님 부족한 책인데 자세히 읽어주셔서 감사드립니다. 순서대로 말씀드리겠습니다.

ratsgo commented 4 years ago
hccho2 commented 4 years ago

@hccho2 님 부족한 책인데 자세히 읽어주셔서 감사드립니다. 순서대로 말씀드리겠습니다.

  • page: 98/ Kkma형태소 분석 결과와 Mecb 분석 결과에 오타가 있습니다. 저도 오타를 나중에야 발견하고 깜짝 놀랐습니다. 2쇄에 다음과 같이 반영했습니다. 정오표에도 공지해 두겠습니다.
스크린샷 2019-11-28 오전 11 58 10
ratsgo commented 4 years ago
hccho2 commented 4 years ago

'corpus_mecab.txt'가 맞네요. 이 부분은 제가 잘 못 이해했네요^^

ratsgo commented 4 years ago
ratsgo commented 4 years ago