Open Guangming92 opened 2 months ago
例如提供的traindata中的图片,如何微调训练,只对图片中狗进行描述?训练数据如何准备? 复现您给到的案例,有个问题,就是已经添加了torch_dtype=torch.bfloat16, attn_implementation='flash_attention_2',我用的是4090,24G显存,迭代第一步以后,显存就不够用了~还有什么办法可以降低一下吗?
还可以:
例如提供的traindata中的图片,如何微调训练,只对图片中狗进行描述?训练数据如何准备? 复现您给到的案例,有个问题,就是已经添加了torch_dtype=torch.bfloat16, attn_implementation='flash_attention_2',我用的是4090,24G显存,迭代第一步以后,显存就不够用了~还有什么办法可以降低一下吗?