Closed yusanshi closed 2 years ago
您好,还有一个问题,我看large数据集上train set, val set, test set是有重叠用户历史纪录的,而small数据集train set和val set没有重叠用户,训练模型的话需要保证是相同的用户吗?
Originally posted by @whxhx in https://github.com/yusanshi/news-recommendation/issues/32#issuecomment-1103347034
这个主要取决于所用的方法吧,如果模型需要用到 user id 属性的话(比如 LSTUR),那么就最好保证 val/test set 中的 user id 在 train set 都出现过;如果模型只需要用到用户历史的话,那么 user id 是否在 train set 出现就无所谓了
您好,还有一个问题,我看large数据集上train set, val set, test set是有重叠用户历史纪录的,而small数据集train set和val set没有重叠用户,训练模型的话需要保证是相同的用户吗?
Originally posted by @whxhx in https://github.com/yusanshi/news-recommendation/issues/32#issuecomment-1103347034