Open syleeie2310 opened 6 months ago
리뷰 텍스트 길이 => outlier 고려해서 그림 다시 그려보기? 혹은 다른 방법 고민..
1) reviewer 별로 리뷰 갯수 분포 (1개, 2개, 3개...<- 반복구매 해도 잡히는거고), asin 유니크 갯수 분포 (반복구매 -> 1개로 잡히는거고)
2) asin 별로 리뷰어 갯수를 확인하여 분포를 확인하기 => asin 필터링 하고 싶어. 인기 없는 상품이라 1명만 리뷰 매긴 asin이야. 그 asin은 빼고 싶은데 몇명까지 매긴 asin 이면 뺴야될지 몰라
기초 탐색
리뷰 날짜 분포 확인하기 (2개 카테고리)
96년 ~ 18년 일별로 리뷰 갯수 분포 확인하기 -> 시각화로 그려주세요 (리뷰 갯수>리뷰어 갯수) (2개 카테고리 특성 다른지 봐주고)
평점 분포 => 월별/연도별로 평점 분포가 변경이 되는지?
모든 컬럼 (vote, style feature, verified)
리뷰 텍스트 길이
통계량 위주로 데이터 정리해보기