llm-jp experiments issues

llm-jp / experiments

Issue-Only Pretrain Task Management Repository

0 stars 0 forks source link

issues

Newest

Newest Most commented Recently updated Oldest Least commented Least recently updated

[コーパス] - 日本語におけるCosmopedia手法の生成文評価-69続き

#74 YusukeNakamura69 opened 1 day ago
0
[事前学習] - v3コーパスを使用したBERTの事前学習

#73 k141303 opened 3 days ago
0
[事前学習] - MoE Baseline2

#72 Taishi-N324 opened 4 days ago
0
[事前学習] - MoE Baseline1

#71 Taishi-N324 opened 4 days ago
0
[チューニング] - llm-jp-3-172b-beta2-instruct の学習

#70 Taka008 opened 5 days ago
0
[コーパス] - 日本語におけるCosmopedia手法の生成文評価

#69 YusukeNakamura69 opened 1 week ago
2
[事前学習] (ドメイン適応WG)拡張データを用いた事前学習実験と評価 (BY xzhao)

#68 xzhao-tkl opened 1 week ago
0
[事前学習] - Loss spikeの分析

#67 speed1313 opened 1 week ago
0
[事前学習] - 継続事前学習の学習率スケジューリング検討 (LLM-jp-3 13B)

#66 odashi opened 1 week ago
0
[事前学習] (ドメイン適応WG)拡張データを用いた事前学習実験

#65 YumaTsuta opened 1 week ago
0
[コーパス] - LLM-jp-3 172B の訓練データのダンプ

#64 hkiyomaru opened 1 week ago
0
[転送] - TSUBAMEのデータの転送

#63 Taishi-N324 opened 2 weeks ago
0
[事前学習] - Megatron-LMを用いたBERTの学習の練習

#62 speed1313 opened 2 weeks ago
0
[事前学習] - MoE Baseline2

#61 Taishi-N324 closed 4 days ago
1
[評価] - llm-jp-eval 1.4.1による統合評価

#60 odashi opened 2 weeks ago
1
[事前学習] - MoE Baseline1

#59 Taishi-N324 closed 4 days ago
1
[マルチモーダルWG] - VLMモデルの評価

#58 speed1313 closed 3 weeks ago
0
[マルチモーダルWG] - PDFからテキスト抽出

#57 ZhishenYang opened 3 weeks ago
0
[マルチモーダルWG] - マルチモーダルモデル学習　ablation

#56 ssgw-keito opened 3 weeks ago
0
[評価] - MoE btx 8x1.56B

#55 cr-liu opened 3 weeks ago
0
[事前学習] - 172B-exp1 checkpointのHugging Face形式への変換

#54 k141303 opened 4 weeks ago
0
[評価] - v3 172B exp2 ベースモデル評価

#53 k141303 opened 4 weeks ago
0
[マルチモーダルWG] - PDFからテキスト抽出

#52 ZhishenYang closed 3 weeks ago
0
[マルチモーダルWG] - マルチモーダルモデル学習　追加実験

#51 ssgw-keito opened 1 month ago
0
[マルチモーダルWG] - マルチモーダルモデル学習 (VILA step-2)

#50 ssgw-keito opened 1 month ago
0
[チューニング] - チューニング用インストラクションデータ開発

#49 Taka008 opened 1 month ago
0
[マルチモーダルWG] - CLIPの学習

#48 speed1313 opened 1 month ago
0
[チューニング] - チューニングデータ検証

#47 k141303 opened 1 month ago
0
[マルチモーダルWG] - 医学文献からテキスト抽出

#46 ZhishenYang closed 3 weeks ago
0
[マルチモーダルWG] - relaion-2b-en-research-safeのgemmaによる翻訳

#45 speed1313 closed 2 weeks ago
2
[転送] - TSUBAMEで学習を行った70Bモデルの転送

#44 Taishi-N324 closed 1 month ago
2
[マルチモーダルWG] - マルチモーダルモデル学習 (VILA step-1)

#43 ssgw-keito opened 1 month ago
0
[チューニング] - 1.7B, 3.8B, 13B の公開用モデルチューニング

#42 Taka008 opened 1 month ago
0
[評価] - v3 7.3B exp1 ベースモデル評価

#41 odashi closed 1 week ago
0
[事前学習] - v3 7.3B ベースモデルのHF形式への変換

#40 odashi closed 1 week ago
0
[事前学習] - MoE Branch train mix 1.56bx8

#39 cr-liu opened 1 month ago
0
[事前学習] - 継続事前学習の学習率スケジューリング検討（v3 1.7B exp2ベース）

#38 Taka008 opened 1 month ago
0
[事前学習] - v3 7.3B exp1

#37 odashi closed 1 week ago
0
[評価] - v3 1.7B exp2 cpt (2nd epoch) ベースモデル評価

#36 Taka008 closed 3 weeks ago
1
[事前学習] - v3 1.7B exp2 cpt (2nd epoch) モデルのHugging Face形式への変換

#35 Taka008 closed 3 weeks ago
1
[事前学習] - loss spikeの原因調査

#34 odashi opened 1 month ago
0
[評価] - Data Contaminationのツール開発と手法を比較する研究

#33 PosoSAgapo opened 1 month ago
2
[事前学習] - 複数ユーザーでの同一ジョブ管理

#32 k141303 opened 1 month ago
0
[事前学習] - FP8適用時の学習器の挙動確認

#31 odashi opened 2 months ago
0
[事前学習] - v3 1.7B exp2 の継続事前学習（v3コーパス2周目の有効性検証）

#30 Taka008 closed 3 weeks ago
1
[事前学習] - Upcycleを用いて8×3.78Bモデルの構築をする

#29 Taishi-N324 closed 6 days ago
1
[評価] - v3 3.8B exp1 ベースモデル評価

#28 odashi closed 1 month ago
1
[事前学習] - v3 3.8B exp1モデルのHugging Face形式への変換

#27 odashi closed 1 month ago
1
[評価] - v3 172B exp2 ベースモデル評価

#26 odashi opened 2 months ago
2
[チューニング] - LLMCのチューニング実験

#25 Taka008 closed 3 weeks ago
4