读文献遇到了一些困难求解答 - Githubissues

DataXujing / YOLOv9

:fire: YOLOv9 paper解析，训练自己的数据集，TensorRT端到端部署， NCNN安卓手机部署

GNU General Public License v3.0

57 stars 11 forks source link

读文献遇到了一些困难求解答 #2

Closed oahnah closed 6 months ago

oahnah commented 6 months ago

为什么叫做可编程还有辅助可逆分支是在代码中怎么体现可逆的？

DataXujing commented 6 months ago

我认为的PGI paper作者指的是一个全新的模型架构：参考

上图中的(d)即为PGI的模型架构,具体的block是由GELAN堆叠得到的。

所谓的可逆是在卷积提取过程中随着层数的增加特征图和梯度丢失了原图像的太多信息，可逆是保证信息丢失尽可能最小
作者给的解决办法就是PGI + GELAN, 通过类似于Co-DETR的辅助分支和多级辅助信息，达到可逆的目的，其效果如下：

比ResNet还要好！

注意一点的是：辅助分支只在训练过程中作为监督学习来学习更新模型参数，我们在推断过程中是把辅助分支扔掉了，只用了主分支（TensorRT和NCNN转模型前对onnx模型编辑的时候去掉了辅助分支）！