llm-jp / experiments

Issue-Only Pretrain Task Management Repository
0 stars 0 forks source link

[評価] - v3 172B exp2 ベースモデル評価 #53

Open k141303 opened 1 month ago

k141303 commented 1 month ago

Overview

アブレーション論文のため、v3 172B exp1 ベースモデルの評価を行います。

Details

HF変換済みモデルを用いてx step毎(要相談)のチェックポイントごとに評価を行います。

Resources