llm-jp / experiments

Issue-Only Pretrain Task Management Repository
0 stars 0 forks source link

[事前学習] - 継続事前学習の学習率スケジューリング検討 (LLM-jp-3 13B) #66

Open odashi opened 1 month ago

odashi commented 1 month ago

Overview

38 と同じ実験を LLM-jp-3 13Bで実施する。

Details

基本的には下記の設定を試す。

Resources