Closed luthfianto closed 8 years ago
kataku sih buang
Aku mau propose untuk coba impute productGroup dengan semi-supervised. http://scikit-learn.org/stable/modules/label_propagation.html Caranya: returnQuantity di-drop sementara. productGroup yang missing ditandain -1, terus productGroup dijadiin y/label
Kalau emang ga ngefek, yaudah sekalian drop kolom productGroup. Kalau bisa, nanti kita semua jangan drop rows ya (takut pengaruh ke kolom prior probability, ya nggak?), kecuali kalau yakin emang aman untuk drop rows.
Ada yang mau ambil ini?
tapi dipikir-pikir, untuk menebak productGroup, parameternya apa ya?
parameter yang lain seperti orderID, customerID dkk technically sebagai parameter untuk menebak productGroup ya bisa-bisa aja. tapi agak dipertanyakan sih, takut bikin kacau
tapi benda seperti kemeja dan sabuk harganya bisa bervariasi sih. mungkin aja ada sabuk seharga kemeja
yaudahlah drop aja kali ya? atau coba impute dulu deh. bebas deh
lho bukan articleID ya malah? namanya juga product group. Entah deng pendapatku doang ._.
tapi gimana sih caranya ngimpute-- misal parameternya buat nebak productGroup, trs gmn caranya dia tau articleID x productGroupnya apa?
udah fixed buang aja
Tidak terlalu signifikan. Mau diapakan?
cc: @amirahff @meisyarahd @rochanaph