Open jeffzhengye opened 3 years ago
你说的这个有一定的道理,因为esmm计算从view->conversion 因为非常稀疏,可能会有一些batch里面没有正常本, 但是实际操作过程中,应该尽量避免这种情况,如果很多batch里面都没有正样本,这其实是不利于模型的学习的。
你说的这个有一定的道理,因为esmm计算从view->conversion 因为非常稀疏,可能会有一些batch里面没有正常本, 但是实际操作过程中,应该尽量避免这种情况,如果很多batch里面都没有正样本,这其实是不利于模型的学习的。
阿里的数据集大概有30%多没有正例(去5000batch_size)。
感觉x-deeplearning 中auc 计算batch auc,把其中只包含negative的batch 算作invalid 抛弃,这个做法跟tensorflow里面做法不一样。会比较大的影响auc的计算,因为一个batch中没有positive 也会影响全局的FP,auc应该算全局的。 具体请看: https://github.com/alibaba/x-deeplearning/issues/355