Open mingnuj opened 8 months ago
너무 띄엄띄엄이지만 일단 씁니다 ^.^
YOLO v3까지 쓴 Joseph Redmon이 아닌 다른 사람들이 이어서 작성한 논문이다. 메인 작업자는 Alexey Bochkovskiy로, 필자에게는 이 사람이 더 익숙하다. 당시 최신 기술을 적용하여 YOLO의 기능을 발전시킨 내용을 주로 다루고 있다.
YOLO v4는 2020년 최신 기술을 사용해서 성능을 높이고, 독자적인 기술 또한 갖추었다. 그 과정에서 관련 객체 탐지 기술에 대한 정리를 잘 해두었는데 가볍게 짚고 넘어가고자 한다.
CSPDarknet53
block을 추가(additional blocks)
bottom-up path와 top-down path를 집계(path-aggregation blocks)
SPP
PAN
SPP(Spatial Pyramid Pooling)
PAN(Path Augmented Network)
Dense Predication (one-stage)
Sparse Predication (two-stage)
Data augmentation과 같은 데이터 전처리부터, Loss function, Regularization등과 같이 학습에 관여하는 요소로, 모델 학습에만 영향을 주어 정확도를 높이는 방법이다. 줄여서 BoF라고 부른다.
BoF
작성 중
너무 띄엄띄엄이지만 일단 씁니다 ^.^
YOLO v4
YOLO v3까지 쓴 Joseph Redmon이 아닌 다른 사람들이 이어서 작성한 논문이다. 메인 작업자는 Alexey Bochkovskiy로, 필자에게는 이 사람이 더 익숙하다. 당시 최신 기술을 적용하여 YOLO의 기능을 발전시킨 내용을 주로 다루고 있다.
논문 정보
Object Detection Model
YOLO v4는 2020년 최신 기술을 사용해서 성능을 높이고, 독자적인 기술 또한 갖추었다. 그 과정에서 관련 객체 탐지 기술에 대한 정리를 잘 해두었는데 가볍게 짚고 넘어가고자 한다.
Image
Backbone
CSPDarknet53
을 사용CSPDarknet53
: DenseNet 기반의 layer의 feature map을 분할 후 Cross-Stage Hierarchy 방법을 통해 결합하여 연산량을 획기적으로 낮춘 모델Neck
block을 추가(additional blocks)
하거나,bottom-up path와 top-down path를 집계(path-aggregation blocks)
하는 방법을 사용SPP
와PAN
을 사용SPP(Spatial Pyramid Pooling)
: conv layer의 마지막 feature map을 고정된 크기의 grid로 분할한 후 평균을 구해 고정된 크기의 representation을 얻음PAN(Path Augmented Network)
: Bottom-up Path Augmentation을 통해 low-level feature의 정보를 high-level feature에 효과적으로 전달함으로써 객체 탐지 시 localization 성능을 향상한 네트워크Head
Dense Predication (one-stage)
와Sparse Predication (two-stage)
가 있다.Bag of Freebies (전처리)
Data augmentation과 같은 데이터 전처리부터, Loss function, Regularization등과 같이 학습에 관여하는 요소로, 모델 학습에만 영향을 주어 정확도를 높이는 방법이다. 줄여서
BoF
라고 부른다.Data Augmentation
작성 중
참고