Open YumaTsuta opened 3 weeks ago
This PR adds scripts for model evaluation using llm-jp-eval (v1.4.1). It includes a setup script for creating the environment to run the evaluation script, as well as a script for running the offline evaluation using vLLM.
一通りのデバッグは完了しました。 README.mdなどの細かい修正が残っているので後ほど
@odashi @hkiyomaru とりあえずレビュアーに割り当てさせてもらいました。 llm-jp-evalでvLLM関連の変更が数日中にあるかもしれないため、その変更を取り込む場合、追加で修正します
llm-jp-evalの改修待ちになったため、draftに変更
477a5ac で envs/ も不要になった気がします
ご指摘ありがとうございます。README.mdの変更も必要ですが、取り急ぎリーダーボードの方ためのサンプルスクリプトとしてアップロードしたかったので、細かい修正は後ほど行なっていきます
This PR adds scripts for model evaluation using llm-jp-eval (v1.4.1). It includes a setup script for creating the environment to run the evaluation script, as well as a script for running the offline evaluation using vLLM.