wogur0915 / Hot_Place_NLP_Project

맛집 리뷰 감성분석 NLP 프로젝트
MIT License
0 stars 0 forks source link

사용할 자연어처리 라이브러리 #10

Closed wogur0915 closed 11 months ago

wogur0915 commented 11 months ago

한국어에 적합한 자연어처리 라이브러리를 고민해보는 시간

wogur0915 commented 11 months ago
  1. KoNLPy

특징: 한국어 형태소 분석, 품사 태깅 등 기본적인 NLP 기능을 제공. 장점: 다양한 한국어 형태소 분석기를 포함하고 있어 (예: Okt, Mecab, Komoran, Hannanum, Kkma) 선택의 폭이 넓다. 단점: 형태소 분석에 중점을 두고 있어, 보다 고급 NLP 작업에는 제한적일 수 있다.

wogur0915 commented 11 months ago
  1. Mecab-ko

특징: 일본어 형태소 분석기 Mecab을 기반으로 한국어를 처리하기 위해 수정된 버전. 장점: 빠른 처리 속도와 높은 정확도를 제공. 단점: 설치 과정이 다소 복잡할 수 있으며, Python 환경 이외에서는 사용이 제한적일 수 있다.

wogur0915 commented 11 months ago
  1. KoBERT, KoGPT

특징: 최신 딥러닝 기술을 기반으로 한 BERT와 GPT 모델의 한국어 버전. 장점: 매우 높은 성능을 제공하며, 다양한 고급 NLP 작업에 적용할 수 있다. 단점: 자원 소모가 크고, 모델 학습과 사용이 복잡할 수 있다.

wogur0915 commented 11 months ago
  1. Khaiii

특징: 카카오에서 개발한 한국어 형태소 분석기. 장점: 높은 정확도와 균형 잡힌 처리 속도를 제공한다. 단점: 설치 과정이 다소 복잡하며, Python 환경에 최적화되어 있다.

wogur0915 commented 11 months ago
  1. Etri

특징: 한국전자통신연구원(ETRI)에서 제공하는 한국어 처리 API 서비스. 장점: 광범위한 기능을 제공하며, 고품질의 분석 결과를 얻을 수 있다. 단점: 인터넷 연결이 필요하며, API 사용에 대한 비용이 발생할 수 있다.

wogur0915 commented 11 months ago

정확한 리뷰 분석을위해 한국어 형태소 분석과 품사태깅이 가능한 konlpy를 선택하기로 결정