关于7X7频域的问题

cfzd / FcaNet

FcaNet: Frequency Channel Attention Networks

MIT License

508 stars 100 forks source link

Open Soso-developer opened 1 year ago

Soso-developer commented 1 year ago

大于7X7大小的图像，是如何选取在某个频域上的值呢？例如：1414大小图像经过dct得到1414的dct结果，如果选取最低频的分量，那么实际的选取是，最左上角的2*2大小结果的平均值吗？没有理解代码里的计算方式，希望得到答疑

cfzd commented 1 year ago

@Soso-developer 你的理解是对的，14x14的最低频和7x7的最低频是不一样的，可以说7x7每个频谱“更宽”一些，我们总是把图像缩放到7x7再提取频谱的。

Soso-developer commented 1 year ago

@Soso-developer 你的理解是对的，14x14的最低频和7x7的最低频是不一样的，可以说7x7每个频谱“更宽”一些，我们总是把图像缩放到7x7再提取频谱的。

看到您讲的：“我们总是把图像缩放到7x7再提取频谱的”，也就是说不同大小图像均需要压缩到7X7 请问压缩具体是如何压缩的呢？这个操作会对图像本身频谱产生影响吗？

cfzd commented 1 year ago

@cfzd 抱歉，我搞错了，太久了都忘记了，实际上我们在提取频谱时会提取一个相对位置的频率，可以看看这部分代码： https://github.com/cfzd/FcaNet/blob/aa5fb63505575bb4e4e094613565379c3f6ada33/model/layer.py#L38-L41 所以当我们提取最低频时，在7x7的图上是(1,1)这个位置，而在14x14的图上是(2,2)这个位置

Soso-developer commented 1 year ago

好的理解了，感谢您的回答！