WWW '20 | MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding

之前的工作忽略了几个问题

没有考虑node feature (这说的基本是random walk only的方法，比如metapath2vec #330 , HERec #333 ）
对于一个metapath，之前的工作如HERec #333 和HAN #328 只保留了头尾两个node，而中间的nodes都丢弃了，造成了信息丢失

所以提出了Metapah Aggregated GNN(MAGNN). 基本都是attention. 分两步

intra-matapath aggregation: 对于一个metapath instance，对路径上所有node embedding做一个self-attention，得到这个metapath instance的embedding. 有多个metapath instances，对这多个metapath embedding做一个self-attention，得到这个节点v在这个metapath上的node embedding.
跟HAN一样，就是不同metapath的node embedding再做一次self-attention，得到节点v最终的node embedding.

其实和HAN的区别就在于第一步: HAN只考虑metapath首尾的neighbor，直接用这些metapath-based neighbors的node embedding做一个self-attention得到节点v在这个metapath上的node embedding. MAGNN多了一步对metapath路上所有nodes的node embedding的aggregate而已，而不是只用最后一个.

最后效果在LASTFM link prediction上比GATNE #341 和HAN强很多.

如果某些node type没有node feature怎么办？文中好像没有提及. 但又提到LASTFM这个数据集没包括node feature.

看了代码，直接onehot. 6

https://github.com/cynricfu/MAGNN/blob/master/run_LastFM.py#L45

jasperzhong / read-papers-and-code

WWW '20 | MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding #340