A GEMM tutorial.
去 src/cuda 文件夹下面,找到你想看性能的 gemm,记住那个名字,然后回到主项目文件夹下,首先mkdir build,然后输入 make benchmark_xxx。
src/cuda
mkdir build
make benchmark_xxx
如你想看 double_buffer_yhs_refine_gemm.cu 这个矩阵乘的性能,就输入:
double_buffer_yhs_refine_gemm.cu
make benchmark_double_buffer_yhs_refine
然后二进制会出现在 bin 文件夹下面。
bin
知乎链接:这里