Closed wanghuancoder closed 1 month ago
DataLoader产生的Tensor有很多pinned memory的,在模型训练过程中,每使用一次Dataloader的Tensor就会发生一次同步H2D拷贝,造成CPU打断,进而影响性能。 本PR集中、异步将pinned Tensor转到GPU上。
Thanks for your contribution!
DataLoader产生的Tensor有很多pinned memory的,在模型训练过程中,每使用一次Dataloader的Tensor就会发生一次同步H2D拷贝,造成CPU打断,进而影响性能。 本PR集中、异步将pinned Tensor转到GPU上。