hakubishin3 / booking-challenge-2021

Booking.com Challenge - WebTour 2021 ACM WSDM workshop https://www.bookingchallenge.com/
5 stars 0 forks source link

booker_countryについて調べる #6

Closed hakubishin3 closed 3 years ago

hakubishin3 commented 3 years ago

Why

What

hakubishin3 commented 3 years ago
agg_train = train.groupby("utrip_id")["booker_country"].apply(lambda x: len(np.unique(x)))
agg_test = test.groupby("utrip_id")["booker_country"].apply(lambda x: len(np.unique(x)))
len(agg_train), len(agg_train[agg_train != 1]), len(agg_test), len(agg_test[agg_test != 1])
(217686, 398, 70662, 151)

utrip_id では基本的に booker_country が同じ. なので, booker_country は ユーザの国 という扱いができるだろう.

ただし, utrip_idbooker_country が異なるケースがいくつかある. これは旅行中に予約したことによって生じてるのだろう.