Closed hakubishin3 closed 3 years ago
agg_train = train.groupby("utrip_id")["booker_country"].apply(lambda x: len(np.unique(x)))
agg_test = test.groupby("utrip_id")["booker_country"].apply(lambda x: len(np.unique(x)))
len(agg_train), len(agg_train[agg_train != 1]), len(agg_test), len(agg_test[agg_test != 1])
(217686, 398, 70662, 151)
utrip_id
では基本的に booker_country
が同じ.
なので, booker_country
は ユーザの国 という扱いができるだろう.
ただし, utrip_id
で booker_country
が異なるケースがいくつかある.
これは旅行中に予約したことによって生じてるのだろう.
Why
What