shibing624 / similarity

similarity: Text similarity calculation Toolkit for Java. 文本相似度计算工具包,java编写,可用于文本相似度计算、情感分析等任务,开箱即用。
https://shibing624.github.io/similarity/
Apache License 2.0
1.41k stars 325 forks source link

PhraseSimilarity 短语相似度是如何计算出来的 #23

Closed weixiewen closed 3 years ago

weixiewen commented 3 years ago

如题,Java新手,勉强成功跑起了程序了。并代入了自己的数据进行测试。 想了解下在计算短语相似度的时候,是采用了什么算法和方法进行计算呢。

shibing624 commented 3 years ago

PhraseSimilarity 短语相似度, 通过词与词的编辑距离简单计算得到。

shibing624 commented 3 years ago

参考实现:https://github.com/shibing624/similarity/blob/master/src/main/java/org/xm/similarity/phrase/PhraseSimilarity.java