shibing624 / similarity

similarity: Text similarity calculation Toolkit for Java. 文本相似度计算工具包,java编写,可用于文本相似度计算、情感分析等任务,开箱即用。
https://shibing624.github.io/similarity/
Apache License 2.0
1.41k stars 325 forks source link

如果希望将句子和词语之间做匹配应该如何操作合适呢? #38

Open Ask-sola opened 1 year ago

Ask-sola commented 1 year ago

我希望将一个句子直接进行分类,但是我手上没有一个标注好的分类数据集,所以只能求助于开放的模型,通过暴力匹配计算相似度来实现句子分类。那么如果直接将句子和词语编码后计算相似度,是否会有相似性的性能体现出来呢?

shibing624 commented 1 year ago

用向量匹配批量计算,会快些。我另一个用python写的相似度计算项目:https://github.com/shibing624/similarities 可以实现语义匹配。