kakao / khaiii

Kakao Hangul Analyzer III
Apache License 2.0
1.41k stars 284 forks source link

출력을 텍스트 파일로 뽑을 수 있을까요? #84

Closed donyjjuny closed 4 years ago

donyjjuny commented 4 years ago

아니면 단어만 저장하려고 하는데요

krikit commented 4 years ago

@donyjjuny 원하시는 바를 좀 더 구체적으로 말씀해 주실 수 있을까요? bin/khaiii 프로그램의 출력 포맷이 원하는 형태가 아니라는 말씀이세요? 아니면 python에서 khaiii 실행 결과 중 품사태그를 제외한 형태소만 파일로 저장하고 싶으신가요?

rumbarum commented 4 years ago

@donyjjuny 질문하신 의도가 konlpy 처럼 뭔가 나오길 기대하신게 맞나요? Khaiii 안에 따로 결과물을 보여주는 메소드를 찾지 못해서 아래와 같이 작성해서 사용했습니다. 질문에 답변이 됐으면 좋겠네요.

from khaiii  import KhaiiiApi
khaiii = KhaiiiApi()

def khaiii_analyze(sentence):
    return khaiii.analyze(sentence)

#konlpy pos() 와 동일한 결과물 양식
def khaiii_pos(sentence):
    prep = khaiii_analyze(sentence)
    pos_list = [ (prep[i].morphs[k].lex, prep[i].morphs[k].tag )  for i,j in enumerate(prep) for k,l in enumerate(j.morphs)]
    return pos_list

#konlpy noun과 동일한 결과물 양식
def khaiii_noun(sentence):
    prep = khaiii_analyze(sentence)
    pos_list = [ (prep[i].morphs[k].lex, prep[i].morphs[k].tag )  for i,j in enumerate(prep) for k,l in enumerate(j.morphs)]
    return [s for s,k in pos_list if k == "NNG"]