Open luthfianto opened 8 years ago
DMC 2015: Ipynb & Analisis iyus
LinearRegression (tapi terus outputnya dibulatkan dengan round()
) itu ampuh lho. Tapi nggak semua orang harus LinearRegression, karena yang dicari di ensemble justru perbedaannya
Tapi buat eksplorasi, pake LinearRegression aja dibanding RandomForestRegressor, lebih cepet
Mungkin featureimportances RandomForestRegressor dipakai nanti aja pas reduksi fitur
OOT: biar enak browsing Github, jangan lupa pakai OctoTree ya https://chrome.google.com/webstore/detail/octotree/bkhaagjahfmjljalopjnoealnfndnagc
Fitur-fitur dari Tim DMC 2014 Iowa State Uni bagus nih untuk referensi tambahan, casenya mirip kan. https://github.com/xydrolase/dmc-2014/blob/master/featgen%2Ffeat_gen.R#L109
Contoh fitur:
yang meanspend.by.cid
kalau di kita udah, namanya customer_budget
. yang lainnya boleh lah dicoba-coba
Ada juga solusi dari tim peringkat 4, belum terlalu kulihat: https://github.com/fhirschmann/ml_dmc2014