yusanshi / news-recommendation

Implementations of some methods in news recommendation.
MIT License
241 stars 50 forks source link

训练模型的话需要保证是相同的用户吗? #35

Closed yusanshi closed 2 years ago

yusanshi commented 2 years ago

您好,还有一个问题,我看large数据集上train set, val set, test set是有重叠用户历史纪录的,而small数据集train set和val set没有重叠用户,训练模型的话需要保证是相同的用户吗?

Originally posted by @whxhx in https://github.com/yusanshi/news-recommendation/issues/32#issuecomment-1103347034

yusanshi commented 2 years ago

这个主要取决于所用的方法吧,如果模型需要用到 user id 属性的话(比如 LSTUR),那么就最好保证 val/test set 中的 user id 在 train set 都出现过;如果模型只需要用到用户历史的话,那么 user id 是否在 train set 出现就无所谓了