Open TryHard-LL opened 1 year ago
您好,在使用DDP训练时,程序会卡住不动,且GPU占用率100%,请问这个是数据的问题嘛【此处是使用自己的数据】?
看看具体的情况
怎么卡主
当时用多卡时,会出现在跑一些batch后,显存占用率直接到100%,同时程序不再处理/训练新的batch。
您好,我也发生了一样的情况,DP可以正常训练,但是换成DDP会在中间卡主,请问您是怎么解决这个问题的?我使用的也是自建的数据集
你好,我也遇到这个问题了,请问DDP训练时卡住,这个问题怎么解决的呢
您好,在使用DDP训练时,程序会卡住不动,且GPU占用率100%,请问这个是数据的问题嘛【此处是使用自己的数据】?