Open no5-aaron-wu opened 2 years ago
https://no5-aaron-wu.github.io/2021/12/23/AI-Algorithm-14-GEMM-V2/
前言 在上篇文章中介绍了how to optimize gemm是如何优化GEMM算法的性能,但他最终的优化结果就是理论极限吗?显然不是,下面将在其基础上进一步探究GEMM性能优化的边界。 测试环境 CPU:Intel Core i7 8700,3.2GHz主频,支持AVX2,FMA3,Coffee Lake(Skylake)架构 操作系统:WSL-Ubuntu-18.04 L1 Cache S
https://no5-aaron-wu.github.io/2021/12/23/AI-Algorithm-14-GEMM-V2/
前言 在上篇文章中介绍了how to optimize gemm是如何优化GEMM算法的性能,但他最终的优化结果就是理论极限吗?显然不是,下面将在其基础上进一步探究GEMM性能优化的边界。 测试环境 CPU:Intel Core i7 8700,3.2GHz主频,支持AVX2,FMA3,Coffee Lake(Skylake)架构 操作系统:WSL-Ubuntu-18.04 L1 Cache S