Closed jasperzhong closed 1 year ago
挺有意思的文章,解决了一个important问题. 异构图里面,很多node type是压根没有feature的. 比如IMDB数据集有movie, actor和director三种node types,但只有moive有node feature; DBLP数据集只有paper有node feature,而其他的author, venue, term都没有node feature. (比如MAG240M,只有paper有feature,其他node type比如author, institution都是没有feature的. 这都可以总结为一个系统challenge了.)
之前的方法,如MAGNN #340 和 HAN #328 会用one-hot编码来表示term和venues,对于author用其发表paper的node feature的平均值. 本文提出可以补全缺失的node feature,达到更好的效果.
大概方法分为两步:
为了避免过拟合,第二步会随机drop一些已知的node features,然后重新预测其node feature,并且计算其loss.
确实更强了.
想了下,这个方法可以带参数,也可以不带参数,主要取决于怎么算attention score.
最简单,点乘就行. 复杂点也可以像GAT那样,给node embedding乘一个权重matrix.
如果带参数就需要算loss来优化.
其实我感觉不带参数更简洁一些,就是weighted aggregate. 比naive的mean aggregate更make sense,利用了topology信息.
https://yangliang.github.io/pdf/www21.pdf