Closed hbj52152 closed 1 year ago
您好,请问在配置正常的情况下,跑一遍readme.md里的训练示例大概用多长时间? 希望有一个参照确认是否配置正确了
单卡 RTX3060 cuda 11.7
示例: python3 train_qlora.py \ --train_args_json chatGLM_6B_QLoRA.json \ --model_name_or_path THUDM/chatglm-6b \ --train_data_path data/train.jsonl \ --eval_data_path data/dev.jsonl \ --lora_rank 4 \ --lora_dropout 0.05 \ --compute_dtype fp32
@hbj52152 3060的话29小时左右,3090在7~8小时左右
您好,请问在配置正常的情况下,跑一遍readme.md里的训练示例大概用多长时间? 希望有一个参照确认是否配置正确了
单卡 RTX3060 cuda 11.7
示例: python3 train_qlora.py \ --train_args_json chatGLM_6B_QLoRA.json \ --model_name_or_path THUDM/chatglm-6b \ --train_data_path data/train.jsonl \ --eval_data_path data/dev.jsonl \ --lora_rank 4 \ --lora_dropout 0.05 \ --compute_dtype fp32