增量训练问题 - Githubissues

训练word2vec类似的模型时候实际上模型里面有两组参数：中心词向量，上下文向量。通常我们用的都是中心词向量，但是训练的时候二者都需要的，这样在训练的时候先得找到上下文向量，这个项目中对二者都有提供，可以参考项目中的Various Co-occurrence Information。至于对词汇表的修改，目前没有看到公开的实现，之前尝试过修改fasttext代码，似乎是最简单可以实现的，你可以试试。

实际上，微调（fine tune）更多是在训练下游任务的时候调整，具体是用预训练的词向量初始化embedding table里面的参数，之后一并训练，这样的效果一般来说是最好的，特别是采用Deep Learning的时候。

Embedding / Chinese-Word-Vectors

增量训练问题 #30