PaddlePaddle / PaddleRec

Recommendation Algorithm大规模推荐算法库,包含推荐系统经典及最新算法LR、Wide&Deep、DSSM、TDM、MIND、Word2Vec、Bert4Rec、DeepWalk、SSR、AITM,DSIN,SIGN,IPREC、GRU4Rec、Youtube_dnn、NCF、GNN、FM、FFM、DeepFM、DCN、DIN、DIEN、DLRM、MMOE、PLE、ESMM、ESCMM, MAML、xDeepFM、DeepFEFM、NFM、AFM、RALM、DMR、GateNet、NAML、DIFM、Deep Crossing、PNN、BST、AutoInt、FGCNN、FLEN、Fibinet、ListWise、DeepRec、ENSFM,TiSAS,AutoFIS等,包含经典推荐系统数据集criteo 、movielens等
https://paddlerec.readthedocs.io/
Apache License 2.0
4.26k stars 721 forks source link

ESMM只有10万条数据吗 #778

Open mojinyu123 opened 2 years ago

mojinyu123 commented 2 years ago

请问ESMM 用的ali-ccp的全量数据34M的数据有放出来吗,现在放出的全量数据只有10万条,在上面训练很容易过拟合?

wangzhen38 commented 2 years ago

我们提供的该数据集目的是为了方便用户快速跑通,效果上确实会有折扣,全量数据请参考 https://tianchi.aliyun.com/dataset/dataDetail?dataId=408&userId=1