any86 / Notes

:rocket: 笔记
https://github.com/any86/Notes/issues
28 stars 9 forks source link

yolo v3学习笔记 #100

Open any86 opened 1 year ago

any86 commented 1 year ago

还在学习中, 先记录一些关键点 , 稍后补充文字, 形成完整的笔记

遍历3种特征图的每一个像素, 输出tx,ty.tw,th,confidence, classes

image

tx/ty是特征图中的偏移量, 实际特征图中的每一个像素对应到原图上是多个像素, 所以特征图下的位置bx其实是个小数, 公式如下: bx = cx + sigmoid(tx), 这样保证调整偏差后bx依旧和cx是同一个格子内的点

th/tw是预设锚框缩放的比例, pw/ph是预设锚框的尺寸, 所以bw = pw * exp(tw), 这里是exp是指数运算, 具体为什么用exp我也没太弄明白, 总之就好求导, 因为指数的导数还是自己本身, 后续再深入研究明白他.