no5-aaron-wu / no5-aaron-wu.github.io

aaron-wu的个人博客
0 stars 0 forks source link

AI算法基础 [8]:MNN中的ConvolutionTiled实现 | 旭穹の陋室 #36

Open no5-aaron-wu opened 2 years ago

no5-aaron-wu commented 2 years ago

https://no5-aaron-wu.github.io/2021/11/22/AI-Algorithm-8-ConvTiledInMnn/

前言 一般卷积,主要针对CPU后端,基于/source/backend/cpu/compute/ConvolutionTiledExecutor.cpp源码展开。 以下面的数据输入为例,由于kernelX != kernelY,因此Strassen和Winograd均不适用。 input: 1 x 8 x 224 x 224,C4 Pack格式为: 1 x 2 x 224 x 224 (x 4)