Closed hexists closed 4 years ago
개발 환경 설치: IntelliJ 설치 후 Scala Plugin을 설치합니다.
repo clone: okt repo를 clone하고, IntelliJ에서 pom.xml 파일을 열어줍니다.
noun의 적절한 파일에 사용자사전을 추가합니다.
- 가이드에 있는 wikipedia_title_nouns.txt에 "노잼노씨", "문자어"를 추가했습니다.
- src/main/resources/org/openkoreantext/processor/util/noun/wikipedia_title_nouns.txt
src/main/scala/org/openkoreantext/processor/tools/DeduplicateAndSortDictionaries.scala 를 실행해서 사전을 정리합니다.
테스트를 실행해서 원하는대로 token이 나눠지는지 확인합니다.
- examples/src/main/scala/ScalaOpenKoreanTextExample.scala
- 위 파일을 누르고, run 버튼을 누릅니다.
터미널로 이동해서, mvn compile을 하고 문제가 없는 경우 mvn package로 패키징합니다.
$ mvn compile
$ mvn package
konlpy는 소스를 받아 사용합니다.
git clone git@github.com:konlpy/konlpy.git
target 디렉토리에 생성된 jar 파일을 konlpy로 복사하고, 기존에 있던 okt.jar 파일의 이름으로 symbolic link를 설정합니다. 기존 okt.jar 파일은 이름을 바꿔 따로 저장해놓습니다.
$ cp /path/to/open-korean-text/target/open-korean-text-2.3.2-SNAPSHOT.jar /path/to/konlpy/java/
$ cd /path/to/konlpy/java/
$ mv open-korean-text-2.1.0.jar open-korean-text-2.1.0.jar.org
$ ln -sf open-korean-text-2.3.2-SNAPSHOT.jar open-korean-text-2.1.0.jar
$ ./test_okt.py
Okt 명사 추출 Results
['노잼노씨', '잼', '신조어', '등', '문자어', '등록']
konlpy okt 사전 추가 방법