Closed oahnah closed 6 months ago
上图中的(d)即为PGI的模型架构,具体的block是由GELAN堆叠得到的。
所谓的可逆
是在卷积提取过程中随着层数的增加特征图和梯度丢失了原图像的太多信息,可逆
是保证信息丢失尽可能最小
作者给的解决办法就是PGI + GELAN, 通过类似于Co-DETR的辅助分支和多级辅助信息,达到可逆
的目的,其效果如下:
比ResNet还要好!
注意一点的是:辅助分支只在训练过程中作为监督学习来学习更新模型参数,我们在推断过程中是把辅助分支扔掉了,只用了主分支(TensorRT和NCNN转模型前对onnx模型编辑的时候去掉了辅助分支)!
为什么叫做可编程 还有辅助可逆分支是在代码中怎么体现可逆的?