Closed hwangnakjoo closed 3 years ago
Check out this pull request on
See visual diffs & provide feedback on Jupyter Notebooks.
Powered by ReviewNB
우선 모델에 사용할 변수로 생각해본건 아래와 같은데, 다들 의견 어떠신지 공유해주심 감사하겠습니다~
기본변수 1)user_id 2)d_type 3)goods_type 4)ad1 5)서비스 이용한 요일
기상변수 6)일최고기온 7)불쾌지수 (+강수/적설량으로 만든 컬럼?)
교통량변수 8)일교통량합계
기타 9)직전까지 누적이용건수에 따른 유저레벨 10)직전 이용일과 해당 이용일의 날짜 차이를 기준으로 나눈 활성화레벨
우선 모델에 사용할 변수로 생각해본건 아래와 같은데, 다들 의견 어떠신지 공유해주심 감사하겠습니다~
기본변수 1)user_id 2)d_type 3)goods_type 4)ad1 5)서비스 이용한 요일
기상변수 6)일최고기온 7)불쾌지수 (+강수/적설량으로 만든 컬럼?)
교통량변수 8)일교통량합계
기타 9)직전까지 누적이용건수에 따른 유저레벨 10)직전 이용일과 해당 이용일의 날짜 차이를 기준으로 나눈 활성화레벨
정리해주신 기본변수, 기상변수, 교통량변수 모두 동의합니다! 기상변수에서 강수량과 적설량 단위 통일한 후에 그 둘을 어떻게 조합을 해보면 유의미하지 않을까?라는 생각은 있었는데 그 생각에서 더 나아가진 못했네요,,, 만약 해당 피처가 유의미하다면 포함시키는 것도 좋을 것 같습니다.
그리고 누적이용건수에 따른 유저레벨은 꼭 모델에 넣어보면 좋을 것 같고, 활성화 레벨 피처에 대해선 아직 확신은 못하겠지만 일단 모델에 넣었을 때와 넣지 않았을 때를 비교해보고 판단하는 것도 괜찮을 것 같습니다!
v1.0 파일로 봐주세요! EDA에 꼭 추가했으면 좋겠다 하는 거 전부 말씀해주세요. 찬서님께는 모델링을 위해 필요한 변수 말씀해주시길 부탁드립니다.