Closed wogur0915 closed 9 months ago
현재 모델의 정확도, 정밀도, 재현율, f1스코어를 출력한 모습이다.
데이터를 검증하기위해 matrix를 출력하니 불균형이 있는것으로 보임
정확도가 낮은 원인은 여러개가있음. 데이터 불균형, 특성(Feature) 선택 또는 추출 미흡, 과소적합(Underfitting), 하이퍼파라미터 설정 등이 있는데 이중 데이터의 불균형이 주 원인으로 생각됨
데이터 불균형 처리를 위해서는 SMOTE(Synthetic Minority Over-sampling Technique) 같은 오버샘플링 방법을 사용하거나, 소수 클래스에 더 높은 가중치를 부여하는 방법으로 클래스 불균형을 처리할 수 있음
불균형 해소 후 재 모델링 시도할것
리뷰데이터로 학습시킨 로지스틱 회귀 모델의 정확도가 생각보다 좋지 않다. 높이는 방법에 대해서 알아보자