Orion-wyc / GAGA

Fraud Detection, Low Homophily, Label Utilization, Graph Mining
42 stars 3 forks source link

Ablation Study of GA #2

Open wzy9191 opened 6 months ago

wzy9191 commented 6 months ago

您好,我想问一下在消融实验中移除GA模块,是采用简单的均值聚合替代。 是只是取消分组,但跳数、关系还保留 还是说聚合成一个单独向量,如果是这种方式,后面的可学习编码部分该如何处理,这种方式感觉可学习编码部分也相应失效了

Orion-wyc commented 6 months ago

您好,我想问一下在消融实验中移除GA模块,是采用简单的均值聚合替代。 是只是取消分组,但跳数、关系还保留 还是说聚合成一个单独向量,如果是这种方式,后面的可学习编码部分该如何处理,这种方式感觉可学习编码部分也相应失效了

您好,您的表述是正确的。本文“消融实验中移除GA模块”采用的前者,即“只是取消分组,但跳数、关系还保留”,同时“采用简单的均值聚合替代”。

简要地说,文中对GA的描述,可以理解为使用部分观察到的标记信息(先验标记)对邻域中的节点分组。移除GA就无法在预处理阶段生成对应分组序列(参考论文Figure2-Oerview),但是我们仍可以将每一阶邻居信息平均聚合成一个向量,生成“跳数、关系“序列进行训练,此时序列长度$S = (1 + K) \times R$。此时,可学习编码部分不包含X_g。

如若需要复现实验或自定义聚合方式,可以修改下preprocessing目录下的data_utils.py 以及 graph2seq_mp.py,将GroupFeatureSequenceLoader._group_aggregation替换为所需的聚合函数。