VinaTsai / xgboost_notebook

0 stars 0 forks source link

INN和OOT的KS,AUC差异大 #14

Open VinaTsai opened 3 years ago

VinaTsai commented 3 years ago

image

INN和OOT的特征差异

  1. 检查特征的IV,WOE在INN和OOT是否有反转
  2. 检查特征在INN和OOT的稳定性:缺失率、均值、分位值

进一步查找存在人为缺失的特征

VinaTsai commented 3 years ago

INN和OOT的特征差异较大,可如下处理

调整样本权重(前提:上线后的样本特征不存在人为缺失

  1. 特征有人为缺失的样本放入训练集
  2. 特征无人为缺失的样本权重调高

Stacking

有一批样本,A+B,AB都有 10个变量,B除了A有的10个变量还有另外2个变量

  1. 先用A+B 10个变量 训练一个模型 a
  2. 单独在B上用 这个base模型分 y_hat_a +2个变量 训练一个模型 b
VinaTsai commented 3 years ago

IV, WOE

https://zhuanlan.zhihu.com/p/80134853