kakao / khaiii

Kakao Hangul Analyzer III
Apache License 2.0
1.4k stars 285 forks source link

파이썬에서 형태소를 딕셔너리 형태로 뽑는 방법이 없을까요? #82

Closed dduzzi closed 4 years ago

dduzzi commented 4 years ago

안녕하세요, 파이썬 초보라 그런데 khaiii를 이용하여 형태소 분석을 해보고 싶습니다.

파이썬에 빌드 및 설치까지 했고 정상 작동한것 까지 확인을 했는데

konlpy의 나와있는것 처럼 (에컨데 twitter.pos(문장) ) 형태소 리스트를 뽑아 워드클라우드로 만들려고 합니다.

혹시 형태소를 딕셔내리 형태로 뽑는 방법은 없을까요?

krikit commented 4 years ago

KoNLPy와 인터페이스를 맞추는 작업은 성능이 어느정도 개선되고 진행하려 했는데요.. ^^;

다음과 같은 방법으로 사용하시면 될 것 같습니다.

morphs = []
for word in api.analyze('원하는 문장을 넣으세요.'):
    for morph in word.morphs:
        morphs.append((morph.lex, morph.tag))
pprint(morphs)
[('원하', 'VV'),
 ('는', 'ETM'),
 ('문장', 'NNG'),
 ('을', 'JKO'),
 ('넣', 'VV'),
 ('으시', 'EP'),
 ('어요', 'EF'),
 ('.', 'SF')]

혹은 더 간단하게,

morphs = [(morph.lex, morph.tag) for word in api.analyze('원하는 문장을 넣으세요.') for morph in word.morphs]

이렇게 하시면 됩니다.

dduzzi commented 4 years ago

덕분에 잘 쓰겠습니다 ㅠ 너무 잘돌아가네요.

너무너무 감사합니다 ㅠㅠ!!!!