Open DeqiangXIA opened 4 years ago
请问作者,对于目标检测来说,该项目为什么是将mask映射在所截取的物体上,而不是映射在整张输入图片上?
@DeqiangXIA 感谢您的反馈,可以映射到整张图像上,越靠近输出的语义信息更明显,所以原始的CAM取的是倒数第一个卷积层特征;对于目标检测最后几层卷积都是正对某个边框的,自然出来的就是裁剪后的边框,可以取更浅层的整张图像上的特征的梯度,但是在更浅层语义信息会越弱。
请问作者,对于目标检测来说,该项目为什么是将mask映射在所截取的物体上,而不是映射在整张输入图片上?