Open yang-xiaofeng1101 opened 2 years ago
https://xiao_feng_yang993.gitee.io/2020/04/10/GPUDirect-RDMA-for-openmpi/
背景对于MPI跨节点项目,对GPU上的数据一般需要先cudaMemcopy到Host,再通过mpi_send出去,另一设备通过mpi_Recv到Host内存,再cudamemcopy到GPU显存,这一过程明显要费时。 1. compile openmpi with –with-cuda这一编译方法可以让openmpi对显存的数据操作,但是它只是减少了代码的书写量,从GPU到Host的数据传输在背后
https://xiao_feng_yang993.gitee.io/2020/04/10/GPUDirect-RDMA-for-openmpi/
背景对于MPI跨节点项目,对GPU上的数据一般需要先cudaMemcopy到Host,再通过mpi_send出去,另一设备通过mpi_Recv到Host内存,再cudamemcopy到GPU显存,这一过程明显要费时。 1. compile openmpi with –with-cuda这一编译方法可以让openmpi对显存的数据操作,但是它只是减少了代码的书写量,从GPU到Host的数据传输在背后