shibing624 / text2vec

text2vec, text to vector. 文本向量表征工具,把文本转化为向量矩阵,实现了Word2Vec、RankBM25、Sentence-BERT、CoSENT等文本表征、文本相似度计算模型,开箱即用。
https://pypi.org/project/text2vec/
Apache License 2.0
4.39k stars 392 forks source link

The difference between STSB and STSBenchmark #111

Closed staoxiao closed 1 year ago

staoxiao commented 1 year ago

您好, 请问一下您发布的数据集STSB(1.36k rows) (https://huggingface.co/datasets/shibing624/nli_zh/viewer/STS-B/test)为什么与STSBenchmark(https://huggingface.co/datasets/stsb_multi_mt/viewer/zh/test)数据集数量不同(1.38k rows)?您是做了什么过滤吗?

shibing624 commented 1 year ago

自行对比。