liyu199809 / PineappleHouse

1 stars 1 forks source link

可以提供转换好的SentenceTransformers 形式的gte-large-en-v1.5 checkpoint吗? #1

Open shishijier opened 3 months ago

shishijier commented 3 months ago

我是kdd比赛的组织者,为了复现下最终结果。

Haidee180 commented 3 months ago

你好,SentenceTransformers 形式的checkpoint提供如下: 百度网盘:链接:https://pan.baidu.com/s/1SU2syhD_t3LCCdMriZhxXA?pwd=1111 提取码:1111

shishijier commented 2 months ago

你好,SentenceTransformers 形式的checkpoint提供如下: 百度网盘:链接:https://pan.baidu.com/s/1SU2syhD_t3LCCdMriZhxXA?pwd=1111 提取码:1111

另外问一下,你们有测试 gte-large-en-v1.5(finetuned), GritLm-7B, SFR-Embedding-Mistral, NV-Embed-v1, Linq-Embed-Mistral 这五个模型中,哪两个模型预测结果分数最高呢?

Haidee180 commented 2 months ago

您好,在我们最终集成的模型中,Linq-Embed-Mistral(约为0.187)和SFR-Embedding-Mistral(约为0.184)效果最好。由于硬件设备的限制,我们的推理长度只开到2048,一定程度限制了模型的性能。 我们观察到,模型的集成具有强烈的边际效应,集成带来的效果提升总体来讲是迅速衰减的。此外,我们在验证集阶段尝试了难例并取得了很好的效果;但在测试集中,使用难例微调的模型效果糟糕,故并未加入最终结果。