abess-team / abess

Fast Best-Subset Selection Library
https://abess.readthedocs.io/
Other
474 stars 41 forks source link

风险评分优化 #540

Open cfkstat opened 3 months ago

cfkstat commented 3 months ago

风险评分卡的开发,我们通常需要找到一个Logistic回归模型满足如下条件认为是最优的(给定变量入模数量,限制条件最优):

  1. 给定一个训练集(train)和验证集(test),训练和验证是不同时点的贷款数据最终的风险表现(客户是否逾期)。
  2. Score1 = AUC_train - if(abs(AUC_train-AUC_test) >= 0.015, abs(AUC_train-AUC_test), 0.5*abs(AUC_train-AUC_test))
  3. Score2 = KS_train- if(abs(KS_train-KS_test) >= 0.03, abs(KS_train-KS_test), 0.5*abs(KS_train-KS_test)) 评分1和评分2都可以作为一个评价函数,这里要test测试集上不参与模型训练的,所以交叉验证是不能用的,test只能用来评价模型函数。