Open Soso-developer opened 1 year ago
@Soso-developer 你的理解是对的,14x14的最低频和7x7的最低频是不一样的,可以说7x7每个频谱“更宽”一些,我们总是把图像缩放到7x7再提取频谱的。
@Soso-developer 你的理解是对的,14x14的最低频和7x7的最低频是不一样的,可以说7x7每个频谱“更宽”一些,我们总是把图像缩放到7x7再提取频谱的。
看到您讲的:“我们总是把图像缩放到7x7再提取频谱的”,也就是说不同大小图像均需要压缩到7X7 请问压缩具体是如何压缩的呢?这个操作会对图像本身频谱产生影响吗?
@cfzd 抱歉,我搞错了,太久了都忘记了,实际上我们在提取频谱时会提取一个相对位置的频率,可以看看这部分代码: https://github.com/cfzd/FcaNet/blob/aa5fb63505575bb4e4e094613565379c3f6ada33/model/layer.py#L38-L41 所以当我们提取最低频时,在7x7的图上是(1,1)这个位置,而在14x14的图上是(2,2)这个位置
好的理解了,感谢您的回答!
大于7X7大小的图像,是如何选取在某个频域上的值呢? 例如:1414大小图像经过dct得到1414的dct结果,如果选取最低频的分量,那么实际的选取是,最左上角的2*2大小结果的平均值吗? 没有理解代码里的计算方式,希望得到答疑