wangyuxinwhy / uniem

unified embedding model
Apache License 2.0
808 stars 61 forks source link

生成embedding的速度比text2vec慢很多 #80

Open ralgond opened 1 year ago

ralgond commented 1 year ago

🐛 bug 说明

m3e生成一组数据的embedding需要15秒,而text2vec只需要2秒。

Python Version

other

wangyuxinwhy commented 1 year ago

m3e 使用的是 sentence transformers 包来进行加载和推理的,正常情况下,不会有一个数量集的差距。可以检查一下代码,看看是不是有别的差异。