jsksxs360 / Word2Vec

对 ansj 编写的 Word2VEC_java 的进一步包装,同时实现了常用的词语相似度和句子相似度计算。
Apache License 2.0
176 stars 81 forks source link

句子相似度计算方法出处 #5

Closed guozhaotong closed 6 years ago

guozhaotong commented 6 years ago

您好!请问计算句子相似度的fastSentenceSimilarity()sentenceSimilarity(),两个方法是参考了什么文献呢?

jsksxs360 commented 6 years ago

你好!

sentenceSimilarity() 实现了 2009 徐帅《面向问答系统的复述识别技术研究与实现》 中的句子相似度计算方法:

1

在 2017 《基于主题相似度的宏观篇章主次关系识别方法》中,蒋峰等人也使用了该计算方法提取特征。

fastSentenceSimilarity() 只是简单地将句子中词语向量的叠加(按位加)作为句子的表示向量,然后直接计算句子向量之间的 Cosine 值。理论依据,可以参见苏剑林《更别致的词向量模型(五):有趣的结果》