amphibian-dev / toad

ESC Team's credit scorecard tools.
https://toad.readthedocs.io
MIT License
487 stars 174 forks source link

toad.selection.select 的iv 计算可以自己指定方法吗 #68

Open xxyy001 opened 3 years ago

xxyy001 commented 3 years ago

toad.selection.select 的iv 计算看源码是指定死了方法,请问可以自己指定吗

Secbone commented 3 years ago

@xxyy001 “自己指定” 是指什么?

xxyy001 commented 3 years ago

@Secbone 指定分箱的方法以及参数

Secbone commented 3 years ago

@xxyy001 你可以先分箱再用 select 筛

xxyy001 commented 3 years ago

@Secbone toad.selection.select(frame, target='target', empty=0.9, iv=0.02, corr=0.7, return_drop=False, exclude=None) 但是这个select函数没有传递分箱的参数呢

xxyy001 commented 3 years ago

还是说你的意思是先分完箱,自己根据这个分箱把iv算好筛了iv之后 再用select 去筛选缺失和相关性么

Secbone commented 3 years ago

@xxyy001 不是,我理解你需要自定义分箱是需要精筛,可以把分箱后的数据放进 select 方法里进行精筛

xxyy001 commented 3 years ago

噢噢,不是的,想利用这个函数按照 指定的分箱方式进行iv 筛选

Padfoot-Zhou commented 3 years ago

@xxyy001 不是,我理解你需要自定义分箱是需要精筛,可以把分箱后的数据放进 select 方法里进行精筛

@xxyy001 你先把你的数据分箱,再送进select,select里就不会进行额外的分箱,优先使用的是你分箱的结果,完整实现你的需求,可以先尝试一下,谢谢