Closed interflow-miao closed 3 years ago
您好: 对于问题一: 1.通过滑动窗口的想法,可以把原始图像划分成许多窗口,为了便于卷积运算,然后将选出的窗口统一缩放成224*244; 2.N_list,window_side还有iou_threshs中的元素是一一对应的,比如,window side为128(在原图上的尺寸)的窗口以0.25为iou阈值选出前两个,ratios里的每一行对应window side里的每个元素所指定大小窗口在特征图上的尺寸,将ratios中的元素乘以网络的output stride 32就是窗口在原图中映射的大小 对于问题二: 1.知道ratios是每个窗口在特征图上的尺寸后,self.avgpools = [nn.AvgPool2d(ratios[i], 1) for i in range(len(ratios))] 便可以理解,就是计算不同尺寸窗口在特征图上的全局平均值
希望我讲清楚了(* ̄︶ ̄)
感谢您的回复! 讲得非常清楚,解决了我的问题!您太棒了,非常感谢~(^▽^)
尊敬的作者您好! 首先非常感谢您分享出的优秀成果。我在看您源码的时候,碰到了一点问题。 我在config.py文件中看到了如下信息:
windows info for CUB
【问题一】 您在论文中提到,part image是通过滑动窗口得到的,我看代码中最后得到的part image大小是用双线性插值到224*224的对吗?那上面的这些参数具体代表什么意思呢?N_list = [2, 3, 2]这个设定我不太理解,既然后面用于非极大值抑制的iou_threshs都是0.25,为什么要分三个?(不知道我理解得对不对)然后ratios是滑动窗的尺寸比例吗?那window_side又是什么呢?
【问题二】 然后关于APPM这块的源码我也读不太懂,可能上述参数的具体含义我理解不清楚导致我读代码的时候碰到比较多的问题,ratios在这里面代表的什么我一直理解不了。能麻烦您帮我注释以下代码的含义吗?非常感谢!! class APPM(nn.Module): def init(self): super(APPM, self).init() self.avgpools = [nn.AvgPool2d(ratios[i], 1) for i in range(len(ratios))]