Open zhangdebin1119 opened 5 years ago
同样的输入文件,一亿语料,用相同100w测试 当core = 1时,auc是0.68 当core = 10时,训练速度提升很大,但是auc是0.65
训练语料按时间顺序和用户,双key排序。
试试只按时间顺序排列样本,不要按用户聚合。 或者把样本完全shuffle一下,再试试。
lr不会发生这个问题,fm,dim >0时会,而且线程越多,降的越多。
你是按照我说的只按时间排序或者shuffle之后又做的实验吗?
同样的输入文件,一亿语料,用相同100w测试 当core = 1时,auc是0.68 当core = 10时,训练速度提升很大,但是auc是0.65
训练语料按时间顺序和用户,双key排序。