luthfianto / dmc-2016

Team: Uni Gadjah Mada 1. Our attempts and solutions for prudsys' Data Mining Cup 2016
1 stars 1 forks source link

selidiki colorCode #13

Closed luthfianto closed 8 years ago

luthfianto commented 8 years ago

Apakah tidak terstruktur? Apakah pakai RAL colour standard? https://en.wikipedia.org/wiki/RAL_colour_standard

amirahff commented 8 years ago

kalau colorCode=colorCode/1000 feature importancenya (menurut random forest) jadi tambah jelek. entah ya, mgkn feature importancenya random forest semakin bervariasi semakin penting (gatau, blm tak cek iya po nggak) atau mgkn harus dibinarize dulu setelahnya? (belum dicoba)

luthfianto commented 8 years ago

@amirahff

atau mgkn harus dibinarize dulu setelahnya? (belum dicoba)

bisa jadi. atau nggak di-binarize, tapi dikombinasi dengan articleID .groupby(['articleID','colorCode/1000']), terus dicari probability-nya

luthfianto commented 8 years ago

Kalau kata @amirahff , nggak mungkin RAL karena ada warna nomor 8800 padahal RAL cuma 8000-8029. Jadi sekarang ini cukup pakai colorCode_prob

luthfianto commented 8 years ago

Closed for awhile due to another high priority issue.