Closed yuyu990116 closed 5 months ago
pytorch:2.3.0
cuda:11.8
flash-attn:2.5.9.post1
python 3.10
unsloth是pip install git+https://github.com/yangjianxin1/unsloth.git 这样下的
不开unsloth可以跑,开了之后max_length改到512,per device_train_batch_size改为1都OOM,是我哪里使用的不对吗 ![Uploading 微信图片_20240603142434.png…]()
RTX 4090 八卡,训练指令torchrun --nproc_per_node={num_gpus} train.py --train_args_file train_args/sft/qlora/yi-6b-sft-qlora.json
pytorch:2.3.0
cuda:11.8
flash-attn:2.5.9.post1
python 3.10
unsloth是pip install git+https://github.com/yangjianxin1/unsloth.git 这样下的
不开unsloth可以跑,开了之后max_length改到512,per device_train_batch_size改为1都OOM,是我哪里使用的不对吗 ![Uploading 微信图片_20240603142434.png…]()