合并sparse table - Githubissues

训练速度的主要瓶颈来自下面几个步骤：

未合并SparseTable之前第1步不是性能瓶颈，性能瓶颈主要在第2步，当tn.layers.EmbeddingFeatures调用次数较多的时候，同一个batch会有多次pull动作，网络开销较大。

将SparseTable合并之后第1步会变为瓶颈，由于需要将所有的特征汇聚起来使用一次请求pull，当batch size较大时，这种方式会非常慢。

Qihoo360 / tensornet