CastellanZhang / alphaFM

Multi-thread implementation of Factorization Machines with FTRL for binary-class classification problem.
MIT License
885 stars 275 forks source link

有类似问题的么?同样1亿语料,单线程训练比多线程,auc高0.02 #18

Open zhangdebin1119 opened 5 years ago

zhangdebin1119 commented 5 years ago

同样的输入文件,一亿语料,用相同100w测试 当core = 1时,auc是0.68 当core = 10时,训练速度提升很大,但是auc是0.65

训练语料按时间顺序和用户,双key排序。

CastellanZhang commented 5 years ago

试试只按时间顺序排列样本,不要按用户聚合。 或者把样本完全shuffle一下,再试试。

zhangdebin1119 commented 5 years ago

lr不会发生这个问题,fm,dim >0时会,而且线程越多,降的越多。

CastellanZhang commented 5 years ago

你是按照我说的只按时间排序或者shuffle之后又做的实验吗?