gqqnbig / cs145project

0 stars 2 forks source link

研究数据每一列的含义 #7

Closed gqqnbig closed 4 years ago

gqqnbig commented 5 years ago

看一下有没有缺失的数据,怎么处理缺失数据

gqqnbig commented 5 years ago

数据集里有的电影没有年份,怎么处理

kellyJin0505 commented 5 years ago

数据集里有的电影没有年份,怎么处理

少部分电影缺失了年份这一数据,但是从很多分类以及模型来看,年份目前不是关联度很大的因素。目前我们还没有加入用户的打分和用户的tag,可以先不用去考虑年份的问题。暂且可以先把它和电影名称连在一起考虑。

kellyJin0505 commented 5 years ago

dataset_description.docx 上传了一个初步的csv文件的简单解释,以及会上传两个合并csv的文件,希望知道大家对于怎么处理数据的其他想法