PaddlePaddle / PaddleRec

Recommendation Algorithm大规模推荐算法库,包含推荐系统经典及最新算法LR、Wide&Deep、DSSM、TDM、MIND、Word2Vec、Bert4Rec、DeepWalk、SSR、AITM,DSIN,SIGN,IPREC、GRU4Rec、Youtube_dnn、NCF、GNN、FM、FFM、DeepFM、DCN、DIN、DIEN、DLRM、MMOE、PLE、ESMM、ESCMM, MAML、xDeepFM、DeepFEFM、NFM、AFM、RALM、DMR、GateNet、NAML、DIFM、Deep Crossing、PNN、BST、AutoInt、FGCNN、FLEN、Fibinet、ListWise、DeepRec、ENSFM,TiSAS,AutoFIS等,包含经典推荐系统数据集criteo 、movielens等
https://paddlerec.readthedocs.io/
Apache License 2.0
4.17k stars 717 forks source link

esmm训练样本格式 #180

Open come-come opened 3 years ago

come-come commented 3 years ago

你好,请问原始训练集经过处理后(reader.py)样本格式是 index,click_label,conversion_label,field_index:feature_index... 此处并没有用到特征具体的value值。可参照PaddleRec/models/multitask/esmm/data/train/small.txt目录下的测试样本。为什么没有特征的val,此处是把所有的特征都当做了离散特征所以只记录了index吗?

frankwhzhang commented 3 years ago

如果是sparse部分 就是直接用fea_id表示,只有dense部分才会有具体的value