Johnson0722 / CTR_Prediction

CTR prediction using FM FFM and DeepFM
746 stars 297 forks source link

您好,请教一个问题 #1

Open johnson-xu01 opened 6 years ago

johnson-xu01 commented 6 years ago
 fields_train_dict = {}
    for field in fields_train:
        with open('dicts/' + field + '.pkl', 'rb') as f:
            fields_train_dict[field] = pickle.load(f)
    fields_test_dict = {}
    for field in fields_test:
        with open('dicts/' + field + '.pkl', 'rb') as f:
            fields_test_dict[field] = pickle.load(f)

这段代码中路径"dicts/"下的field保存的是什么? feature_length和field_cnt是什么关系的?

mymynew commented 6 years ago

里面的值是从预处理的数据中读取对应特征项转成向量后的位置。 这些数据是序列化到文件中的,做训练之前需要读出来。 按作者的代码有step1和step2以及Feature_engineering包下的代码需要先执行。

zccoder commented 6 years ago

请问,按照step1.2操作,不会生成dict文件夹啊!还有,这个代码当时在ctr的比赛中名次如何,作者是怎么确定哪些是类别型数据哪些是数值型数据的?

mymynew commented 6 years ago

@zccoder 你自己看看我上面说的几个文件里的代码,修改下路径就可以生成的,这个我几天前刚跑过。 至于你说这份代码是不是比赛代码,这个我不知道。 我跑了这份代码,50K左右了效果都不好,正确率一直维持0.8上下,loss一直维持在0.3~0.4。本身2分类瞎猜都是50%的正确率,只到0.8,我觉得不咋滴。而且收敛效果不好~ 网上有一些关于这个数据集的信息,可以搜一下,当然,资料不多。

Muniuliuma commented 5 years ago

你成功跑过FFM的程序吗,在inference那个方法厘米,field_aware_interaction_layer这个地方,循环的时候内存都快吃完了,跑的很慢,有遇到过吗

lmxhappy commented 4 years ago

多么希望是一个可以跑通的项目。感觉到能跑通的项目是好项目。

Daniel123jia commented 3 years ago

我没跑通,哎