datawhalechina / hands-on-data-analysis

动手学数据分析以项目为主线,知识点孕育其中,通过边学、边做、边引导来得到更好的学习效果
1.15k stars 357 forks source link

第二章项目集合-第二章:第一节数据清洗及特征处理.ipynb部分答案错误 #15

Open mrcangye opened 2 years ago

mrcangye commented 2 years ago

1.df[df['Age']==None]

df[df['Age']==None]=0
df.head(3)

以上代码无法筛选出NaN值 2.df[df['Age'].isnull()]

df[df['Age'].isnull()] = 0 # 还好
df.head(3)

以上代码可以筛选出NaN值,但是df[df['Age'].isnull()] = 0会将NaN值所在行全部置0,使得结果有误,且后面的重复值相关代码使用的也是这一行代码生成的数据 3.df[df['Age'] == np.nan]

df[df['Age'] == np.nan] = 0
df.head()

以上代码中,np.nan不可以与任何数进行比较。使用np.isnan()进行修复