llm-jp / experiments

Issue-Only Pretrain Task Management Repository
0 stars 0 forks source link

[評価] - MoE btx 8x1.56B #55

Open cr-liu opened 1 month ago

cr-liu commented 1 month ago

Overview

MoE btx 8x1.56B 評価実験。

Details

事前学習モデルIssue: https://github.com/llm-jp/experiments/issues/{id}

数パラグラフ以内で実験に関する詳細を説明してください。 関連するリンクがあれば適宜してください。

Resources