datawhalechina / hands-on-data-analysis

动手学数据分析以项目为主线,知识点孕育其中,通过边学、边做、边引导来得到更好的学习效果
1.18k stars 360 forks source link

第二章第一节数据清洗及特征处理 #11

Open Summerfat opened 2 years ago

Summerfat commented 2 years ago

for循环,numpy.map转换对文本变量进行转换,构造映射时,.nunique()函数里的参数dropna应该是False for feat in ['Cabin', 'Ticket']: label_dict = dict(zip(df[feat].unique(), range(df[feat].nunique(dropna=False)))) df[feat + "_labelEncode"] = df[feat].map(label_dict)

不然的话,'Cabin'的C148这里会返回一个NaN值