sbintuitions / JMTEB

The evaluation scripts of JMTEB (Japanese Massive Text Embedding Benchmark)
Creative Commons Attribution Share Alike 4.0 International
33 stars 10 forks source link

[EVAL REQUEST] pkshatech/GLuCoSE-base-ja-v2 #72

Closed akiFQC closed 2 months ago

akiFQC commented 2 months ago

モデルの基本情報

name: pkshatech/GLuCoSE-base-ja-v2 type: Luke size: 0.1B lang: ja

モデル詳細

https://huggingface.co/pkshatech/GLuCoSE-base-ja-v2

seen/unseen申告

JMTEBの評価データセットの中,training splitをモデル学習に使用した,またはvalidation setとして,ハイパラチューニングやearly stoppingに使用したデータセット名をチェックしてください。

評価スクリプト

その他の情報

lsz05 commented 2 months ago

73

yano0 commented 2 months ago

大変申し訳ないのですが、prefixにE5と同様、query: もしくはpassage: を利用することを想定したモデルとなっています。評価値が自分の手元⬇️と異なることから、評価スクリプトにおいてprefixが正しくついているか確認いただけないでしょうか?

{
    "Classification": {
        "amazon_counterfactual_classification": {
            "macro_f1": 0.7492232749031491
        },
        "amazon_review_classification": {
            "macro_f1": 0.5530707609927811
        },
        "massive_intent_classification": {
            "macro_f1": 0.7979144461303402
        },
        "massive_scenario_classification": {
            "macro_f1": 0.8683641924034757
        }
    },
    "Reranking": {
        "esci": {
            "ndcg@10": 0.9301469431250418
        }
    },
    "Retrieval": {
        "jagovfaqs_22k": {
            "ndcg@10": 0.6979374757372254
        },
        "jaqket": {
            "ndcg@10": 0.6729417850207029
        },
        "mrtydi": {
            "ndcg@10": 0.41858579533990486
        },
        "nlp_journal_abs_intro": {
            "ndcg@10": 0.9029337913460675
        },
        "nlp_journal_title_abs": {
            "ndcg@10": 0.9511153967130517
        },
        "nlp_journal_title_intro": {
            "ndcg@10": 0.7580448576047344
        }
    },
    "STS": {
        "jsick": {
            "spearman": 0.849637366944316
        },
        "jsts": {
            "spearman": 0.8095684318108997
        }
    },
    "Clustering": {
        "livedoor_news": {
            "v_measure_score": 0.5151536908540161
        },
        "mewsc16": {
            "v_measure_score": 0.45782610528001805
        }
    },
    "PairClassification": {
        "paws_x_ja": {
            "binary_f1": 0.623716814159292
        }
    }
}
lsz05 commented 2 months ago

75 で修正したのでcloseさせていただきます。