Closed xueyouluo closed 3 years ago
您好,我这边本地测试,用的2080TI,12G显存,batch size只能设置为6才不会OOM,这正常吗?您这边用的什么机器可以跑bz=32?
你好,我这边使用的是V100-32G,可以尝试使用gradient_accumulation_steps解决OOM问题。
您好,我这边本地测试,用的2080TI,12G显存,batch size只能设置为6才不会OOM,这正常吗?您这边用的什么机器可以跑bz=32?