issues
search
llm-jp
/
experiments
Issue-Only Pretrain Task Management Repository
0
stars
0
forks
source link
issues
Newest
Newest
Most commented
Recently updated
Oldest
Least commented
Least recently updated
[コーパス] - 日本語におけるCosmopedia手法の生成文評価-69続き
#74
YusukeNakamura69
opened
1 day ago
0
[事前学習] - v3コーパスを使用したBERTの事前学習
#73
k141303
opened
3 days ago
0
[事前学習] - MoE Baseline2
#72
Taishi-N324
opened
4 days ago
0
[事前学習] - MoE Baseline1
#71
Taishi-N324
opened
4 days ago
0
[チューニング] - llm-jp-3-172b-beta2-instruct の学習
#70
Taka008
opened
5 days ago
0
[コーパス] - 日本語におけるCosmopedia手法の生成文評価
#69
YusukeNakamura69
opened
1 week ago
2
[事前学習] (ドメイン適応WG)拡張データを用いた事前学習実験と評価 (BY xzhao)
#68
xzhao-tkl
opened
1 week ago
0
[事前学習] - Loss spikeの分析
#67
speed1313
opened
1 week ago
0
[事前学習] - 継続事前学習の学習率スケジューリング検討 (LLM-jp-3 13B)
#66
odashi
opened
1 week ago
0
[事前学習] (ドメイン適応WG)拡張データを用いた事前学習実験
#65
YumaTsuta
opened
1 week ago
0
[コーパス] - LLM-jp-3 172B の訓練データのダンプ
#64
hkiyomaru
opened
1 week ago
0
[転送] - TSUBAMEのデータの転送
#63
Taishi-N324
opened
2 weeks ago
0
[事前学習] - Megatron-LMを用いたBERTの学習の練習
#62
speed1313
opened
2 weeks ago
0
[事前学習] - MoE Baseline2
#61
Taishi-N324
closed
4 days ago
1
[評価] - llm-jp-eval 1.4.1による統合評価
#60
odashi
opened
2 weeks ago
1
[事前学習] - MoE Baseline1
#59
Taishi-N324
closed
4 days ago
1
[マルチモーダルWG] - VLMモデルの評価
#58
speed1313
closed
3 weeks ago
0
[マルチモーダルWG] - PDFからテキスト抽出
#57
ZhishenYang
opened
3 weeks ago
0
[マルチモーダルWG] - マルチモーダルモデル学習 ablation
#56
ssgw-keito
opened
3 weeks ago
0
[評価] - MoE btx 8x1.56B
#55
cr-liu
opened
3 weeks ago
0
[事前学習] - 172B-exp1 checkpointのHugging Face形式への変換
#54
k141303
opened
4 weeks ago
0
[評価] - v3 172B exp2 ベースモデル評価
#53
k141303
opened
4 weeks ago
0
[マルチモーダルWG] - PDFからテキスト抽出
#52
ZhishenYang
closed
3 weeks ago
0
[マルチモーダルWG] - マルチモーダルモデル学習 追加実験
#51
ssgw-keito
opened
1 month ago
0
[マルチモーダルWG] - マルチモーダルモデル学習 (VILA step-2)
#50
ssgw-keito
opened
1 month ago
0
[チューニング] - チューニング用インストラクションデータ開発
#49
Taka008
opened
1 month ago
0
[マルチモーダルWG] - CLIPの学習
#48
speed1313
opened
1 month ago
0
[チューニング] - チューニングデータ検証
#47
k141303
opened
1 month ago
0
[マルチモーダルWG] - 医学文献からテキスト抽出
#46
ZhishenYang
closed
3 weeks ago
0
[マルチモーダルWG] - relaion-2b-en-research-safeのgemmaによる翻訳
#45
speed1313
closed
2 weeks ago
2
[転送] - TSUBAMEで学習を行った70Bモデルの転送
#44
Taishi-N324
closed
1 month ago
2
[マルチモーダルWG] - マルチモーダルモデル学習 (VILA step-1)
#43
ssgw-keito
opened
1 month ago
0
[チューニング] - 1.7B, 3.8B, 13B の公開用モデルチューニング
#42
Taka008
opened
1 month ago
0
[評価] - v3 7.3B exp1 ベースモデル評価
#41
odashi
closed
1 week ago
0
[事前学習] - v3 7.3B ベースモデルのHF形式への変換
#40
odashi
closed
1 week ago
0
[事前学習] - MoE Branch train mix 1.56bx8
#39
cr-liu
opened
1 month ago
0
[事前学習] - 継続事前学習の学習率スケジューリング検討(v3 1.7B exp2ベース)
#38
Taka008
opened
1 month ago
0
[事前学習] - v3 7.3B exp1
#37
odashi
closed
1 week ago
0
[評価] - v3 1.7B exp2 cpt (2nd epoch) ベースモデル評価
#36
Taka008
closed
3 weeks ago
1
[事前学習] - v3 1.7B exp2 cpt (2nd epoch) モデルのHugging Face形式への変換
#35
Taka008
closed
3 weeks ago
1
[事前学習] - loss spikeの原因調査
#34
odashi
opened
1 month ago
0
[評価] - Data Contaminationのツール開発と手法を比較する研究
#33
PosoSAgapo
opened
1 month ago
2
[事前学習] - 複数ユーザーでの同一ジョブ管理
#32
k141303
opened
1 month ago
0
[事前学習] - FP8適用時の学習器の挙動確認
#31
odashi
opened
2 months ago
0
[事前学習] - v3 1.7B exp2 の継続事前学習(v3コーパス2周目の有効性検証)
#30
Taka008
closed
3 weeks ago
1
[事前学習] - Upcycleを用いて8×3.78Bモデルの構築をする
#29
Taishi-N324
closed
6 days ago
1
[評価] - v3 3.8B exp1 ベースモデル評価
#28
odashi
closed
1 month ago
1
[事前学習] - v3 3.8B exp1モデルのHugging Face形式への変換
#27
odashi
closed
1 month ago
1
[評価] - v3 172B exp2 ベースモデル評価
#26
odashi
opened
2 months ago
2
[チューニング] - LLMCのチューニング実験
#25
Taka008
closed
3 weeks ago
4
Next