no5-aaron-wu / no5-aaron-wu.github.io

aaron-wu的个人博客
0 stars 0 forks source link

AI算法基础 [14]:GEMM进一步优化 | 旭穹の陋室 #30

Open no5-aaron-wu opened 2 years ago

no5-aaron-wu commented 2 years ago

https://no5-aaron-wu.github.io/2021/12/23/AI-Algorithm-14-GEMM-V2/

前言 在上篇文章中介绍了how to optimize gemm是如何优化GEMM算法的性能,但他最终的优化结果就是理论极限吗?显然不是,下面将在其基础上进一步探究GEMM性能优化的边界。 测试环境 CPU:Intel Core i7 8700,3.2GHz主频,支持AVX2,FMA3,Coffee Lake(Skylake)架构 操作系统:WSL-Ubuntu-18.04 L1 Cache S