cfzd / FcaNet

FcaNet: Frequency Channel Attention Networks
MIT License
508 stars 100 forks source link

关于7X7频域的问题 #43

Open Soso-developer opened 1 year ago

Soso-developer commented 1 year ago

大于7X7大小的图像,是如何选取在某个频域上的值呢? 例如:1414大小图像经过dct得到1414的dct结果,如果选取最低频的分量,那么实际的选取是,最左上角的2*2大小结果的平均值吗? 没有理解代码里的计算方式,希望得到答疑

cfzd commented 1 year ago

@Soso-developer 你的理解是对的,14x14的最低频和7x7的最低频是不一样的,可以说7x7每个频谱“更宽”一些,我们总是把图像缩放到7x7再提取频谱的。

Soso-developer commented 1 year ago

@Soso-developer 你的理解是对的,14x14的最低频和7x7的最低频是不一样的,可以说7x7每个频谱“更宽”一些,我们总是把图像缩放到7x7再提取频谱的。

看到您讲的:“我们总是把图像缩放到7x7再提取频谱的”,也就是说不同大小图像均需要压缩到7X7 请问压缩具体是如何压缩的呢?这个操作会对图像本身频谱产生影响吗?

cfzd commented 1 year ago

@cfzd 抱歉,我搞错了,太久了都忘记了,实际上我们在提取频谱时会提取一个相对位置的频率,可以看看这部分代码: https://github.com/cfzd/FcaNet/blob/aa5fb63505575bb4e4e094613565379c3f6ada33/model/layer.py#L38-L41 所以当我们提取最低频时,在7x7的图上是(1,1)这个位置,而在14x14的图上是(2,2)这个位置

Soso-developer commented 1 year ago

好的理解了,感谢您的回答!