Open ssgw-keito opened 2 months ago
VILAの学習方法を参考にマルチモーダルモデルの学習を行います。
VILAのstep-0に相当する学習を行なったモデルに対して、step-1に相当する学習を行います。 https://arxiv.org/abs/2312.07533
google/siglip-so400m-patch14-384
mlp2x_gelu
llm-jp/llm-jp-3-13b-instruct
llm-jp-nvlink:/model/sasagawa/VILA-ja/playground/data/coyo-700m/pkl03-split
llm-jp-nvlink:/model/sasagawa/VILA-ja/playground/data/mmc4-core/pkl-core-limit-tokens
llm-jp-nvlink:/model/sasagawa/VILA-ja/playground/data/alt_pair_ja/pkl02
llm-jp-nvlink:/model/sasagawa/VILA-ja/playground/data/mmc4_ja/pkl-limit-tokens
llm-jp-nvlink:/model/experiments/0043_vila_step1/
Overview
VILAの学習方法を参考にマルチモーダルモデルの学習を行います。
Details
VILAのstep-0に相当する学習を行なったモデルに対して、step-1に相当する学習を行います。 https://arxiv.org/abs/2312.07533
google/siglip-so400m-patch14-384
mlp2x_gelu
llm-jp/llm-jp-3-13b-instruct
Resources
llm-jp-nvlink:/model/sasagawa/VILA-ja/playground/data/coyo-700m/pkl03-split
llm-jp-nvlink:/model/sasagawa/VILA-ja/playground/data/mmc4-core/pkl-core-limit-tokens
llm-jp-nvlink:/model/sasagawa/VILA-ja/playground/data/alt_pair_ja/pkl02
llm-jp-nvlink:/model/sasagawa/VILA-ja/playground/data/mmc4_ja/pkl-limit-tokens
llm-jp-nvlink:/model/experiments/0043_vila_step1/