luthfianto / dmc-2016

Team: Uni Gadjah Mada 1. Our attempts and solutions for prudsys' Data Mining Cup 2016
1 stars 1 forks source link

productGroup: simpan, buang, probability? atau... Impute!!!! #5

Closed luthfianto closed 8 years ago

luthfianto commented 8 years ago

Tidak terlalu signifikan. Mau diapakan?

feature_importances_:
 ('quantity', 0.007251995957035318),
 ('voucherAmount', 0.0084270098393323216),
 ('productGroup', 0.013338614492624339),
 ('voucherID', 0.016040803567248609),
 ('paymentMethod', 0.019941250968533431),
 ('deviceID', 0.020316516646024803),
 ('months', 0.026122648399999011),
 ('sizeCode', 0.026651668213207254),
 ('rrp', 0.031491169954646278),
 ('choice_order', 0.039189931417207585),
 ('price', 0.047673059358639566),
 ('order_order', 0.064799658865175275),
 ('colorCode', 0.068958628472941763),
 ('mmdd', 0.072462020638408065),
 ('articleID', 0.073478648965403653),
 ('orderDate', 0.073569468144725342),
 ('total_order', 0.079232118466960516),
 ('after_voucher', 0.082577205489615293),
 ('budget', 0.087331963723963874),
 ('customerID', 0.087644589636466194)]

cc: @amirahff @meisyarahd @rochanaph

amirahff commented 8 years ago

kataku sih buang

luthfianto commented 8 years ago

Aku mau propose untuk coba impute productGroup dengan semi-supervised. http://scikit-learn.org/stable/modules/label_propagation.html Caranya: returnQuantity di-drop sementara. productGroup yang missing ditandain -1, terus productGroup dijadiin y/label

Kalau emang ga ngefek, yaudah sekalian drop kolom productGroup. Kalau bisa, nanti kita semua jangan drop rows ya (takut pengaruh ke kolom prior probability, ya nggak?), kecuali kalau yakin emang aman untuk drop rows.

Ada yang mau ambil ini?

luthfianto commented 8 years ago

tapi dipikir-pikir, untuk menebak productGroup, parameternya apa ya?

parameter yang lain seperti orderID, customerID dkk technically sebagai parameter untuk menebak productGroup ya bisa-bisa aja. tapi agak dipertanyakan sih, takut bikin kacau

tapi benda seperti kemeja dan sabuk harganya bisa bervariasi sih. mungkin aja ada sabuk seharga kemeja

yaudahlah drop aja kali ya? atau coba impute dulu deh. bebas deh

amirahff commented 8 years ago

lho bukan articleID ya malah? namanya juga product group. Entah deng pendapatku doang ._.

tapi gimana sih caranya ngimpute-- misal parameternya buat nebak productGroup, trs gmn caranya dia tau articleID x productGroupnya apa?

luthfianto commented 8 years ago

udah fixed buang aja