clingku / w2v_kr

This repository includes scripts and text resources related to the task of automatic compositionality detection using word2vec embeddings. We test the applicability of the method to ambiguous phrases for Korean language.
Apache License 2.0
1 stars 0 forks source link

세종의미분석말뭉치 training 결과 만들기 #2

Open hauni opened 7 years ago

hauni commented 7 years ago
  1. 입력파일 준비: sjSemTag.txt @wiskingdom a. string__diacriticNumber/tag 형식으로 1차 시도
  2. 출력파일: w2v_sjSemTag_xxx.bin a. xxx 부분에 주요 training 방식 및 parameter 요약내용 들어가게
  3. train 방식 및 parameter 변주 시도하여 결과를 비교 @clingku a. skipgram > CBOW? b. key parameters
wiskingdom commented 7 years ago

to @hauni @tescao

세종 형태의미분석 입력파일 준비 되었습니다. https://drive.google.com/open?id=0B88Za7f7aSrfN3BKTS1TcVlNYlk

스크립트도 올려놓았습니다. https://github.com/clingku/w2v_kr/tree/master/data_preprocessing