sbintuitions / JMTEB

The evaluation scripts of JMTEB (Japanese Massive Text Embedding Benchmark)
Creative Commons Attribution Share Alike 4.0 International
31 stars 9 forks source link

[Feature] prefixの対応 #30

Closed lsz05 closed 4 months ago

lsz05 commented 4 months ago

関連する Issue / PR

29 ついでに#31

PR をマージした後の挙動の変化

挙動の変更を達成するために行ったこと

動作確認

akiFQC commented 4 months ago

現状、 RankingとRetrieval以外の評価にはprefixを設定できない認識なのですが、自分の認識は間違いないでしょうか?

(他のタスクでもprefixを設定できたほうがbetterかなと思ってのご質問です)

lsz05 commented 4 months ago

現状、 RankingとRetrieval以外の評価にはprefixを設定できない認識なのですが、自分の認識は間違いないでしょうか?

(他のタスクでもprefixを設定できたほうがbetterかなと思ってのご質問です)

重複作業なので,やり方としては問題ないかまず確認したいです。 問題なければ他のタスクも同じように変更します。

akiFQC commented 4 months ago

OpenAIEmbedderはpredixの対応がないですが、影響なさそうでしょうか? (大丈夫そうならLGTMです)

lsz05 commented 4 months ago

OpenAIEmbedderはpredixの対応がないですが、影響なさそうでしょうか? (大丈夫そうならLGTMです)

OpenAIEmbedderprefixという引数だけを追加しました。OpenAI embeddingのdocumentのprompt関連の説明がないので実際に使わないようにしています。 自分の理解では,closed modelのため,promptなどの最適化はAPI側に任せてもよく,ユーザ側は素テキストを入れるだけでよいと思いますので。いかがでしょうか?(@akiFQC @masaya-ohagi @ryokan0123 )

akiFQC commented 4 months ago

自分の理解では,closed modelのため,promptなどの最適化はAPI側に任せてもよく,ユーザ側は素テキストを入れるだけでよいと思いますので。いかがでしょうか?

自分は、違和感ないです。