Open no5-aaron-wu opened 2 years ago
https://no5-aaron-wu.github.io/2021/11/22/AI-Algorithm-8-ConvTiledInMnn/
前言 一般卷积,主要针对CPU后端,基于/source/backend/cpu/compute/ConvolutionTiledExecutor.cpp源码展开。 以下面的数据输入为例,由于kernelX != kernelY,因此Strassen和Winograd均不适用。 input: 1 x 8 x 224 x 224,C4 Pack格式为: 1 x 2 x 224 x 224 (x 4)
https://no5-aaron-wu.github.io/2021/11/22/AI-Algorithm-8-ConvTiledInMnn/
前言 一般卷积,主要针对CPU后端,基于/source/backend/cpu/compute/ConvolutionTiledExecutor.cpp源码展开。 以下面的数据输入为例,由于kernelX != kernelY,因此Strassen和Winograd均不适用。 input: 1 x 8 x 224 x 224,C4 Pack格式为: 1 x 2 x 224 x 224 (x 4)