vrolim / datamining

0 stars 0 forks source link

Datamining

Temos no nosso conjunto:

Conjunto 1 - RL_train.csv e RL_test.csv:

transformações convencionais para a regressão.

Conjunto 2 - DT_RI_train1.csv e DT_RI_test1.csv:

Sem nenhuma transformação, para Árvore e Regras.

Conjunto 3 - DT_RI_train2.csv e DT_RI_test2.csv:

Com categorização por frequência de algumas variáveis numéricas. Outra alternativa para Árvores e Regra.

Detalhes

Resultados Regressao - Conjunto 1

AUC: 0,59

Variaveis importantes com significancia 5%:

  1. wait 1.6
  2. stat_last_app_ori 1.1
  3. Alcoholism. 0.3
  4. stat_last_app_First 0.3
  5. n_noshow_passed -0.8
  6. Hipertension -0.3
  7. week_day_Thursda. -0.3
  8. Adm_Zone_VI.....Continente -0.1