CastellanZhang / alphaFM

Multi-thread implementation of Factorization Machines with FTRL for binary-class classification problem.
MIT License
885 stars 275 forks source link

删除频次太少的特征 #12

Closed XuLYC closed 6 years ago

XuLYC commented 6 years ago

大佬,我想让模型训练的时候忽略出现次数太少的特征,直到它出现次数够多了以后再纳入模型。 是不是就在model_unit里面增加一个记录出现次数的变量cnt,然后把src/FTRL/ftrl_trainer.h里面的 if(fabs(mu.w_zi) <= w_l1) 改成 if(fabs(mu.w_zi) <= w_l1 || mu.cnt <= cntThre) 就好了

谢谢大佬

CastellanZhang commented 6 years ago

应该可以,最好实验一下确保无误。

XuLYC commented 6 years ago

收到,谢谢大佬!