Open yaoodng7 opened 3 years ago
您好!感谢对我们工作感兴趣。 问题1:是的 问题2,我们没有对movielens-1m有过特殊处理,跟官网的movielens-1m有什么不一样的吗?
是这样,我用官网的数据集按照timestamp排序然后按相同方法取测试集发现和ml.test.txt不太一样,包括训练集的数据和ml.train.txt也不太相同
哦哦,那可能数据分割之前shuffle过,这没什么影响的
今天又看了一下,和官网不同是因为我们对用户和商品的ID做了一个映射,因为原始数据里用户ID并不是 0~用户数量。为了方便存储,我们先用字典对ID做了一个映射,虽然ID和原始数据不同,但是timestamp排序和连接关系还是一致的
好的,谢谢您!!另外,方便提供一下ENMF论文中Ciao的数据集吗,论文中给的对应网站Not Found。非常感谢!!
OK,请问邮箱是?
yd15109268236@163.com, 如果可以epinions的也麻烦您发我一份,非常感谢!!!
Ok,已经发送了,请查收~
您好,看完ENMF的论文后有两个疑问: 1.ml-1m的数据集的validation data是ml.train.txt中每个用户交互序列的最后一个吗 2.另外,我发现和官网的数据集有不一样,这个数据集是经过什么方法处理过的吗