Closed SunLang115 closed 5 months ago
请问:在cli上运行时,如何使用自定义的数据集
抱歉没有理解这个文档的内容,找不到与MiniCPM-V模型相对应的sfh.sh 能否提示
找不到与MiniCPM-V模型相对应的sfh.sh
https://github.com/modelscope/swift/blob/main/docs/source/Multi-Modal/minicpm-v%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5.md
自定义数据集使用--custom_train_dataset_path
参数
找不到与MiniCPM-V模型相对应的sfh.sh
https://github.com/modelscope/swift/blob/main/docs/source/Multi-Modal/minicpm-v%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5.md 自定义数据集使用
--custom_train_dataset_path
参数
命令行这样: (swift) [sunkaijie@localhost swift]$ CUDA_VISIBLE_DEVICES=0 swift sft \
--model_type minicpm-v-3b-chat \
--custom_train_dataset_path /home/sunkaijie/project/VisualGLM-6B/skin_data/skin_data_split/minicpm_data_train.json
出现这样的错误:
[INFO:swift] PeftModelForCausalLM: 3439.3895M Params (4.4237M Trainable [0.1286%]), 10.4870M Buffers.
[INFO:swift] Setting model.config.use_cache: False
[INFO:swift] Downloading the dataset from ModelScope, datasetid:
Traceback (most recent call last):
File "/home/sunkaijie/project/swift/swift/cli/sft.py", line 5, in
找不到与MiniCPM-V模型相对应的sfh.sh
https://github.com/modelscope/swift/blob/main/docs/source/Multi-Modal/minicpm-v%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5.md 自定义数据集使用
--custom_train_dataset_path
参数
是在命令行直接加上:“ --custom_train_dataset_path (后面跟地址)”吗?
找不到与MiniCPM-V模型相对应的sfh.sh
https://github.com/modelscope/swift/blob/main/docs/source/Multi-Modal/minicpm-v%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5.md 自定义数据集使用
--custom_train_dataset_path
参数
找不到MiniCPM-V模型的sfh.sh,如何使用自定义数据集微调
请问:在cli上运行时,如何使用自定义的数据集; 例如:微调MiniCPM-V时候,找不到对应的sft.sh,只找到了minicpm_2b_sft_chat和minicpm_moe_8x2b;然而利用cli: # Experimental environment: A10, 3090, V100, ... # 10GB GPU memory CUDA_VISIBLE_DEVICES=0 swift sft \ --model_type minicpm-v-3b-chat \ --dataset coco-mini-en-2 \