Open syleeie2310 opened 6 months ago
중카, 소카 레벨 별로 분위수 기준으로 잘라서 그래프 다시 그려보기 (박스 plot 등)
(시각화할 때만)
(새로 변수 보기)
also_view, also_buy 길이 차이/ 길이 분포
기초통계량 ex) 브랜드 유니크, 카테고리 유니크 -> 발표 위한 것
리뷰 데이터만 있는 asin, 메타만, 둘다, -> cell, sport 둘다 봐보기
drop column 오류
ALTER TABLE
https://docs.databricks.com/en/delta/delta-column-mapping.html
2개 카테고리 각각 작업
스포츠, 셀폰 카테고리 가격 분포 탐색
전체로 하지말고 중카 레벨 ---> 평균 가격? 중앙앙 가격? 분위수 (25%, 75%)로 봐야할지?, boxplot으로 보거나? (중카 레벨끼리) 소카 레벨 (소카 레벨끼리)
카테고리에 갯수가 적은 애들은 비교할 때 고민이 필요 (갯수가 적은 카테고리는 제외해서 비교한다던지)