chenchongthu / ENMF

This is our implementation of ENMF: Efficient Neural Matrix Factorization (TOIS. 38, 2020). This also provides a fair evaluation of existing state-of-the-art recommendation models.
MIT License
149 stars 28 forks source link

ml-1m数据集的validation data #6

Open yaoodng7 opened 3 years ago

yaoodng7 commented 3 years ago

您好,看完ENMF的论文后有两个疑问: 1.ml-1m的数据集的validation data是ml.train.txt中每个用户交互序列的最后一个吗 2.另外,我发现和官网的数据集有不一样,这个数据集是经过什么方法处理过的吗

chenchongthu commented 3 years ago

您好!感谢对我们工作感兴趣。 问题1:是的 问题2,我们没有对movielens-1m有过特殊处理,跟官网的movielens-1m有什么不一样的吗?

yaoodng7 commented 3 years ago

是这样,我用官网的数据集按照timestamp排序然后按相同方法取测试集发现和ml.test.txt不太一样,包括训练集的数据和ml.train.txt也不太相同

chenchongthu commented 3 years ago

哦哦,那可能数据分割之前shuffle过,这没什么影响的

chenchongthu commented 3 years ago

今天又看了一下,和官网不同是因为我们对用户和商品的ID做了一个映射,因为原始数据里用户ID并不是 0~用户数量。为了方便存储,我们先用字典对ID做了一个映射,虽然ID和原始数据不同,但是timestamp排序和连接关系还是一致的

yaoodng7 commented 3 years ago

好的,谢谢您!!另外,方便提供一下ENMF论文中Ciao的数据集吗,论文中给的对应网站Not Found。非常感谢!!

chenchongthu commented 3 years ago

OK,请问邮箱是?

yaoodng7 commented 3 years ago

yd15109268236@163.com, 如果可以epinions的也麻烦您发我一份,非常感谢!!!

chenchongthu commented 3 years ago

Ok,已经发送了,请查收~