Open daichi1207 opened 5 days ago
既存のMLLM(LLaVA-phi)を教師モデルとしてSSM(Mamba)ベースのVLMへ蒸留を行います.
llm-jp-nvlink:/model/dyashima/phimamba/playground/data/llava_v1_5_mix665k.json
llm-jp-nvlink:/model/experiments/0081_phimamba
Overview
既存のMLLM(LLaVA-phi)を教師モデルとしてSSM(Mamba)ベースのVLMへ蒸留を行います.
Details
Resources
llm-jp-nvlink:/model/dyashima/phimamba/playground/data/llava_v1_5_mix665k.json
llm-jp-nvlink:/model/experiments/0081_phimamba