Open jaehwan2 opened 3 years ago
저희는 데이터가 1,400건 밖에 되지 않으니 굳이 2세대 모델까지 활용할 필요는 없을 것 같기도 하네요
공유 감사드립니다!!!
저는 user
별로 카테고리/브랜드 연관성 분석을 진행했었는데,
재환님 말씀 참고하여 order_date
기준 일자별, 주차별 연관성 분석 진행한 결과 공유드립니다.
(일단 저희가 가지고 있는 데이터가 많은 양은 아니라 apriori 알고리즘 그대로 적용했어요. 참고부탁드립니다!)
지지도 0.2 이상인 항목이 없습니다.
지지도 min threshold 0.5만 출력
지지도(support) 해석 ex) (chevron quilted cross bag black) (mini sunset chain bag black) 제품이 같은 기간(주)에 대여할 확률
일단 말씀하신대로 구현만 해보았고, 해석에 있어서는 보완이 필요할 것 같습니다..!
빠른 적용 감사합니다...! 알고리즘에 대해 이해했다 생각했다가도 데이터 보면은 어떻게 해석해야할지 헷깔리네요 ㅜ 전달주신 내용으로 저희가 풀어볼 수 있을지 이따 미팅에서 얘기해보도록 해요~ 감사합니다 지인님!
어제 지인님이 올려주신 내용 중 Apriori 알고리즘과 관련된 추가적인 아이디어 공유드립니다. 카테고리 기준으로 연관성을 확인하는 것에 추가로 일자별 goodsnm간의 연관성도 함께 살펴보면 어떨까요? 일자별로 구매된 모든 goodsnm들을 리스트로 만들어 일자별 goodsnm 컬럼을 만들고, 지인님이 작성해주신 알고리즘 적용해보면 무언가 발견할 수도 있지 않을까 싶습니다... Apriori 알고리즘은 전체를 훑어야해서 메모리가 많이 사용되어서 2세대 알고리즘인 FP-Growth나 3세대 FPV와 같은 알고리즘이 있다고 하네요.
참고하실 수 있는 내용 링크로 공유드리니 참고해주시기 바랍니다. http://openuiz.blogspot.com/2018/11/fp-growth-algorithm-frequent-pattern.html
제가 오늘은 개인 작업을 업무 중에 할 수 없어서 확인해봐도 좋겠다고 판단되면, 오늘 미팅 이후나 내일 한번 시도해보도록 하겠습니다~!