x-deeplearning ESMM AUC 计算bug

qiaoguan / deep-ctr-prediction

CTR prediction models based on deep learning(基于深度学习的广告推荐CTR预估模型)

https://github.com/qiaoguan/deep-ctr-prediction

920 stars 277 forks source link

x-deeplearning ESMM AUC 计算bug #17

Open jeffzhengye opened 3 years ago

jeffzhengye commented 3 years ago

感觉x-deeplearning 中auc 计算batch auc，把其中只包含negative的batch 算作invalid 抛弃，这个做法跟tensorflow里面做法不一样。会比较大的影响auc的计算，因为一个batch中没有positive 也会影响全局的FP，auc应该算全局的。具体请看： https://github.com/alibaba/x-deeplearning/issues/355

qiaoguan commented 3 years ago

你说的这个有一定的道理，因为esmm计算从view->conversion 因为非常稀疏，可能会有一些batch里面没有正常本，但是实际操作过程中，应该尽量避免这种情况，如果很多batch里面都没有正样本，这其实是不利于模型的学习的。

jeffzhengye commented 3 years ago

你说的这个有一定的道理，因为esmm计算从view->conversion 因为非常稀疏，可能会有一些batch里面没有正常本，但是实际操作过程中，应该尽量避免这种情况，如果很多batch里面都没有正样本，这其实是不利于模型的学习的。

阿里的数据集大概有30%多没有正例（去5000batch_size）。