可以提供转换好的SentenceTransformers 形式的gte-large-en-v1.5 checkpoint吗？

shishijier commented 3 months ago

我是kdd比赛的组织者，为了复现下最终结果。

Haidee180 commented 3 months ago

你好，SentenceTransformers 形式的checkpoint提供如下：百度网盘：链接：https://pan.baidu.com/s/1SU2syhD_t3LCCdMriZhxXA?pwd=1111 提取码：1111

shishijier commented 2 months ago

你好，SentenceTransformers 形式的checkpoint提供如下：百度网盘：链接：https://pan.baidu.com/s/1SU2syhD_t3LCCdMriZhxXA?pwd=1111 提取码：1111

另外问一下，你们有测试 gte-large-en-v1.5(finetuned), GritLm-7B, SFR-Embedding-Mistral, NV-Embed-v1, Linq-Embed-Mistral 这五个模型中，哪两个模型预测结果分数最高呢？

Haidee180 commented 2 months ago

您好，在我们最终集成的模型中，Linq-Embed-Mistral(约为0.187)和SFR-Embedding-Mistral(约为0.184)效果最好。由于硬件设备的限制，我们的推理长度只开到2048，一定程度限制了模型的性能。我们观察到，模型的集成具有强烈的边际效应，集成带来的效果提升总体来讲是迅速衰减的。此外，我们在验证集阶段尝试了难例并取得了很好的效果；但在测试集中，使用难例微调的模型效果糟糕，故并未加入最终结果。

liyu199809 / PineappleHouse

可以提供转换好的SentenceTransformers 形式的gte-large-en-v1.5 checkpoint吗？ #1