lisosia / cv_knowledge

some note for Computer Vision (日本語)
1 stars 0 forks source link

PAFNet: An Efficient Anchor-Free Object Detector Guidance, 2021 #21

Open lisosia opened 3 years ago

lisosia commented 3 years ago

一言でいうと

アンカーフリーDetectorのガイダンス.
TTFNet(Training Time Friendly Net : CenterNetの亜種) をもとにしている.

Mobile版のbackboneは mobilenetv3-large image

論文リンク

https://arxiv.org/pdf/2104.13534v1.pdf

著者/所属機関

Baidu

投稿日付(yyyy/MM/dd)

概要

新規性・差分

手法

結果

コメント

lisosia commented 3 years ago

Kirin990は Cortex-A76/-A55 の2cpu構成. 4コア計測とのことなので, 実質 Cortex-A76, 2.86 GHz と考えてよさそう.

https://www.notebookcheck.net/HiSilicon-Kirin-990-SoC-Benchmarks-and-Specs.448199.0.html

lisosia commented 3 years ago

実装はPaddlePaddle https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.1/configs/ttfnet/README.md

さっと読んで気が付いたが、PP-Yoloの実装もここ

PP-Yolo-tinyとか、Yolov3Tiny、Yolov3tinyのBackboneをMobilenetV3にした版とかもある.

https://github.com/PaddlePaddle/PaddleDetection/tree/release/2.1/configs/yolov3 https://github.com/PaddlePaddle/PaddleDetection/tree/release/2.1/configs/ppyolo

yolov3 image image pp-yolo image pp-yolo-tiny image

yolov3-mobilenetv3-argeやたらよいきがしたが raspi (3B?) で 8000ms? https://github.com/PaddleCV-FAQ/PaddleDetection-FAQ/blob/main/Lite%E9%83%A8%E7%BD%B2/yolov3_for_raspi.md

こちらにもraspi(3b)のベンチマークがあった https://paddlex.readthedocs.io/zh_CN/develop_en/deploy/raspberry/Raspberry.html#performance-test yolov3-mobilenet-320が1424ms, MobileNetV3_large_ssld-224が133.99msなので、paddlepaddle版のyoloが改造していて重いか, paddlepaddle推論エンジンが悪いかのどちらかそう. 妙に性能が良い(上記)ことから考えると前者か.

lisosia commented 3 years ago

Detectionに必要だろうものがよくまとまっている https://github.com/PaddlePaddle/PaddleDetection

TensorFlow Object Detection API と比べて...