ratsgo / embedding

한국어 임베딩 (Sentence Embeddings Using Korean Corpora)
https://ratsgo.github.io/embedding
MIT License
455 stars 130 forks source link

word2vec 질문 드립니다. #139

Open myoungse opened 6 months ago

myoungse commented 6 months ago

안녕하세요:) '한국어 임베딩' 도서를 통해 자연어처리를 공부 중인 대학생입니다.

Word2Vec 코드를 돌리고 싶은데 anaconda cmd 창에 git pull origin master를 입력 후, bash preprocess.sh dump-tokenized를 입력했는데 cmd창에서

download tokenized data... preprocess.sh: line 5: wget: command not found preprocess.sh: line 6: wget: command not found unzip: cannot find or open tokenized.zip, tokenized.zip.zip or tokenized.zip.ZIP. rm: cannot remove 'tokenized.zip': No such file or directory

이러한 오류가 나서 구글에 검색해봤지만 해결책이 마땅히 나오지 않아 질문드렸습니다.. @ratsgo 님께서 올려주신 preprocess.zip 파일과 tokenized.zip 파일도 설치했습니다!

z

Windows 환경에서 아나콘다 주피터 노트북을 사용 중입니다.