alibaba / euler

A distributed graph deep learning framework.
Apache License 2.0
2.89k stars 559 forks source link

graphsage - use_id embedding #220

Open cozilla opened 4 years ago

cozilla commented 4 years ago

我发现用graphsage use_id后,会增加一个embedding layer. embedding 参数特别大。而且在训练的时候,没有用paritionedVariable造成PS特别慢。想了解一下为何这样?(我打算自己加上partitioned varaiable)

YanZhangN commented 4 years ago

use_id=True,本质上是指encoder阶段时,用node_id做lookup拿到一个维度为dim的embedding向量作为该点的特征。因此参数会增加一个维度为[node_max_id, dim]的矩阵,当图中node_max_id较大时,这个参数就会特别大。可以使用partitioned variable。