wogur0915 / Hot_Place_NLP_Project

맛집 리뷰 감성분석 NLP 프로젝트
MIT License
0 stars 0 forks source link

로지스틱 회귀 모델의 정확도 #12

Closed wogur0915 closed 9 months ago

wogur0915 commented 9 months ago

리뷰데이터로 학습시킨 로지스틱 회귀 모델의 정확도가 생각보다 좋지 않다. 높이는 방법에 대해서 알아보자

wogur0915 commented 9 months ago

image 현재 모델의 정확도, 정밀도, 재현율, f1스코어를 출력한 모습이다.

wogur0915 commented 9 months ago

image 데이터를 검증하기위해 matrix를 출력하니 불균형이 있는것으로 보임

wogur0915 commented 9 months ago

정확도가 낮은 원인은 여러개가있음. 데이터 불균형, 특성(Feature) 선택 또는 추출 미흡, 과소적합(Underfitting), 하이퍼파라미터 설정 등이 있는데 이중 데이터의 불균형이 주 원인으로 생각됨

wogur0915 commented 9 months ago

데이터 불균형 처리를 위해서는 SMOTE(Synthetic Minority Over-sampling Technique) 같은 오버샘플링 방법을 사용하거나, 소수 클래스에 더 높은 가중치를 부여하는 방법으로 클래스 불균형을 처리할 수 있음

wogur0915 commented 9 months ago

불균형 해소 후 재 모델링 시도할것