lisosia / cv_knowledge

some note for Computer Vision (日本語)
1 stars 0 forks source link

You Only Look One-level Feature (YOLOF), CVPR2021 #20

Open lisosia opened 3 years ago

lisosia commented 3 years ago

一言でいうと

YOLO新作 single faeture output mAP/GFLOPSはyolov4より少し弱いくらい ( 細かい条件はそろえていないだろうけど )

yolov4-608 65.7% mAP@0.5 (43.5% AP@0.5:0.95) 128.5BFLOPS yolov4-512 64.9% mAP@0.5 (43.0% AP@0.5:0.95) 91.1 BFlops YOLOF 56.9% mAP@0.5 (37.7% AP@0.5:0.95) / 86GFLOPS

yolov4-608 との比較. yolov4の53FPSはdarknetでのFPSだがTensorRTだと103FPSでているのでどうなのだろう image

論文リンク

著者/所属機関

MEGVII

投稿日付(yyyy/MM/dd)

概要

新規性・差分

手法

結果

コメント

(少なくともYOLOFの場合) ATSSより top k をとるほうが優秀らしい image table 5 image

centernetで object size にサイズ比例する gaussian heatmap より、中心のまわり 9 grid を positive にした方が結果がよいのと同じ話っぽい

lisosia commented 3 years ago

Resnet50よりCSPDarknet53のほうが優秀?スケジューリングが違うので単純比較はできないが https://github.com/megvii-model/YOLOF : image