Open johnson-xu01 opened 6 years ago
里面的值是从预处理的数据中读取对应特征项转成向量后的位置。 这些数据是序列化到文件中的,做训练之前需要读出来。 按作者的代码有step1和step2以及Feature_engineering包下的代码需要先执行。
请问,按照step1.2操作,不会生成dict文件夹啊!还有,这个代码当时在ctr的比赛中名次如何,作者是怎么确定哪些是类别型数据哪些是数值型数据的?
@zccoder 你自己看看我上面说的几个文件里的代码,修改下路径就可以生成的,这个我几天前刚跑过。 至于你说这份代码是不是比赛代码,这个我不知道。 我跑了这份代码,50K左右了效果都不好,正确率一直维持0.8上下,loss一直维持在0.3~0.4。本身2分类瞎猜都是50%的正确率,只到0.8,我觉得不咋滴。而且收敛效果不好~ 网上有一些关于这个数据集的信息,可以搜一下,当然,资料不多。
你成功跑过FFM的程序吗,在inference那个方法厘米,field_aware_interaction_layer这个地方,循环的时候内存都快吃完了,跑的很慢,有遇到过吗
多么希望是一个可以跑通的项目。感觉到能跑通的项目是好项目。
我没跑通,哎
这段代码中路径"dicts/"下的field保存的是什么? feature_length和field_cnt是什么关系的?