WongKinYiu / ScaledYOLOv4

Scaled-YOLOv4: Scaling Cross Stage Partial Network
GNU General Public License v3.0
2.02k stars 574 forks source link

paper question #70

Open chingi071 opened 3 years ago

chingi071 commented 3 years ago

您好,我想請教一下, 我在論文中看到您計算每個 stage 的 CSPDarknet 計算量為 whb^2(9/4+3/4+5k/2) (於 4.1. CSP-ized YOLOv4 中提到), 但在 Table 2 的比較圖中是寫 CSPDarknet 計算量為 whb^2(3/4+5k/2), 想請問一下是我哪裡有遺漏的嗎? 謝謝您。

WongKinYiu commented 3 years ago

學妹好 CSPDarknet53跨stage時的downsampling使用kernel_size=3x3, stride=2的convolutional layer. 所以會額外多 b x (3x3) x (w/2) x (h/2) x b = whb^2(9/4)的運算量 table 2 僅列出 CSPDark layer的運算量

image

chingi071 commented 3 years ago

您好,我了解了,非常感謝學長的回覆!!

WongKinYiu commented 3 years ago

後天要給個talk, 想和您借用下這個項目的圖片

chingi071 commented 3 years ago

好的,沒問題。想請問一下是要用哪些圖片呢?我需要另外提供您什麼資料嗎?

WongKinYiu commented 3 years ago

多謝 我想講一些開發出來的work被實際應用的案例, 不用提供其他資料

  1. 3d object detection
  2. mask detection (您的項目)
FL77N commented 3 years ago

學妹好 CSPDarknet53跨stage時的downsampling使用kernel_size=3x3, stride=2的convolutional layer. 所以會額外多 b x (3x3) x (w/2) x (h/2) x b = whb^2(9/4)的運算量 table 2 僅列出 CSPDark layer的運算量

image

您好,downsampling 時,有一個增大通道數的作用,想請教一下您這個的運算量為啥不是 b/2 x (3x3) x (w/2) x (h/2) x b 呢?其中 b/2 輸入通道數