ChenglongChen / tensorflow-DeepFM

Tensorflow implementation of DeepFM for CTR prediction.
MIT License
2.04k stars 808 forks source link

请问有在criteo数据集测试过性能吗? #34

Open anzhizh opened 6 years ago

huaileiseu commented 5 years ago

我把criteo连续特征离散化(等频离散化成500份)后当成类别特征,所有的类别特征过滤出现少于50次的,dropout都为0.7,DNN为[400,400,400], auc为0.8097左右,然而单纯的DNN都到0.8105了。我自己实现的DeepFM也类似,不知道是什么原因

sunjiaxin111 commented 5 years ago

我把criteo连续特征离散化(等频离散化成500份)后当成类别特征,所有的类别特征过滤出现少于50次的,dropout都为0.7,DNN为[400,400,400], auc为0.8097左右,然而单纯的DNN都到0.8105了。我自己实现的DeepFM也类似,不知道是什么原因

请问你用的criteo是多少数据量,大概要多少内存?

sunjiaxin111 commented 5 years ago

@huaileiseu

LindseyScharpman commented 4 years ago

是用的4千万多数据测试的还是?

huaileiseu commented 4 years ago

我把criteo连续特征离散化(等频离散化成500份)后当成类别特征,所有的类别特征过滤出现少于50次的,dropout都为0.7,DNN为[400,400,400], auc为0.8097左右,然而单纯的DNN都到0.8105了。我自己实现的DeepFM也类似,不知道是什么原因

请问你用的criteo是多少数据量,大概要多少内存?

30g吧差不多

huaileiseu commented 4 years ago

是用的4千万多数据测试的还是?

是的