Closed jasperzhong closed 1 year ago
大概意思就是他们用了一个subgraph来训练一个GCN模型来预测edges应该分配到哪个partition.
在部署的时候,新边首先加到这个subgraph,然后算出embedding然后算出prediction,然后argmax一下得到最后的partition. 可以加一个load balance constraint.
关键是loss function. 参考了GAP这篇论文. 做了一些改动.
用GCN的好处就是不需要维护什么状态,GCN模型很小. 现在SOTA的方法是HDRF,这个方法需要维护一个很大的状态. 对于unbounded graph stream会产生unbounded state. 而GCN的模型大小是bounded.
https://sites.bu.edu/casp/files/2022/05/Zwolak22Bounding.pdf
very interesting !!!