您好，请教一个问题

Johnson0722 / CTR_Prediction

CTR prediction using FM FFM and DeepFM

746 stars 297 forks source link

您好，请教一个问题 #1

Open johnson-xu01 opened 6 years ago

johnson-xu01 commented 6 years ago

 fields_train_dict = {}
    for field in fields_train:
        with open('dicts/' + field + '.pkl', 'rb') as f:
            fields_train_dict[field] = pickle.load(f)
    fields_test_dict = {}
    for field in fields_test:
        with open('dicts/' + field + '.pkl', 'rb') as f:
            fields_test_dict[field] = pickle.load(f)

这段代码中路径＂dicts/＂下的field保存的是什么？ feature_length和field_cnt是什么关系的？

mymynew commented 6 years ago

里面的值是从预处理的数据中读取对应特征项转成向量后的位置。这些数据是序列化到文件中的，做训练之前需要读出来。按作者的代码有step1和step2以及Feature_engineering包下的代码需要先执行。

zccoder commented 6 years ago

请问，按照step1.2操作，不会生成dict文件夹啊！还有，这个代码当时在ctr的比赛中名次如何，作者是怎么确定哪些是类别型数据哪些是数值型数据的？

mymynew commented 6 years ago

@zccoder 你自己看看我上面说的几个文件里的代码，修改下路径就可以生成的，这个我几天前刚跑过。至于你说这份代码是不是比赛代码，这个我不知道。我跑了这份代码，50K左右了效果都不好，正确率一直维持0.8上下，loss一直维持在0.3~0.4。本身2分类瞎猜都是50%的正确率，只到0.8，我觉得不咋滴。而且收敛效果不好~ 网上有一些关于这个数据集的信息，可以搜一下，当然，资料不多。

Muniuliuma commented 5 years ago

你成功跑过FFM的程序吗，在inference那个方法厘米，field_aware_interaction_layer这个地方，循环的时候内存都快吃完了，跑的很慢，有遇到过吗

lmxhappy commented 4 years ago

多么希望是一个可以跑通的项目。感觉到能跑通的项目是好项目。

Daniel123jia commented 3 years ago

我没跑通，哎