PaddleJitLab / CUDATutorial

A self-learning tutorail for CUDA High Performance Programing.
Apache License 2.0
271 stars 29 forks source link

add 手写实现矩阵乘 Matmul #2

Closed AndSonder closed 11 months ago

AndSonder commented 11 months ago

添加 手写实现矩阵乘 Matmul 部分的笔记

AndSonder commented 11 months ago

@Aurelius84 可以帮忙 review 一下嘛

AndSonder commented 11 months ago

赞!非常感谢,另外,是否可以在当前目录提供一个可一键运行的 matmul_raw.cu 文件,可以参考02章节里vector_add.cu范式,以方便新同学可以一键编译运行。

另外可否在当前readme中补充nvcc编译的命令。

done, 还麻烦佬看看可以合了嘛 @Aurelius84

Aurelius84 commented 11 months ago

@AndSonder 合入啦✿✿ヽ(°▽°)ノ✿