Closed programmeguru closed 1 year ago
训练之前,本地把数据集shuffle了可以。训练中通过奇偶对找pair,不要shuffle
多卡训练出来打印的labels在batch中没有成对出现呢,是什么原因呢,我看在dataloader这边labels:tensor([1., 0., 1., 0., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 0.],代码中shuffle看上去也确实都是shuffle=False了的,我训练的时候会出现loss=nan的情况,于是检查了loss=nan的时候的labels,发现labels在batch中并没有成对出现
那你单卡训练。
Describe the Question
Please provide a clear and concise description of what the question is.