Open Ask-sola opened 1 year ago
我希望将一个句子直接进行分类,但是我手上没有一个标注好的分类数据集,所以只能求助于开放的模型,通过暴力匹配计算相似度来实现句子分类。那么如果直接将句子和词语编码后计算相似度,是否会有相似性的性能体现出来呢?
用向量匹配批量计算,会快些。我另一个用python写的相似度计算项目:https://github.com/shibing624/similarities 可以实现语义匹配。
我希望将一个句子直接进行分类,但是我手上没有一个标注好的分类数据集,所以只能求助于开放的模型,通过暴力匹配计算相似度来实现句子分类。那么如果直接将句子和词语编码后计算相似度,是否会有相似性的性能体现出来呢?