ShichenXie / scorecardpy

Scorecard Development in python, 评分卡
http://shichen.name/scorecard
MIT License
725 stars 301 forks source link

update_woebin.py: solution:error in pandas Version: 0.24.2 #21

Closed sunrisehang closed 5 years ago

sunrisehang commented 5 years ago

如果将pandas更新到最新版本0.24.2,运行sc.woebin_ply(train, bins)将会报错:ValueError: fill value must be in categories pandas Version: 0.24.2。 主要因为dtx = dtx.fillna('missing').assign(rowid = dtx.index)这行代码,在0.24.2版本下不兼容。但解决这个问题比较麻烦,所以另辟蹊径。 换了条代码:dtx = dtx.replace(np.nan, 'missing').assign(rowid = dtx.index).sort_values('rowid')可以解决。 也是谢老师加注释的一条,看来确实有先见哈哈。