dev-writeup-2024 / march

개발 1일 1글 스터디
2 stars 0 forks source link

[03-12] YOLO#1 #29

Open mingnuj opened 3 months ago

mingnuj commented 3 months ago

YOLO가 벌써 버전 8까지 나왔다고요? 제 기억 속의 YOLO는 버전 4가 끝이었는데... 그래서 써봅니다.

YOLO v1

객체 탐지 딥러닝에서 유서 깊은 모델이다. 등장은 2015년이지만, CVPR에 등재된 건 2016년이다.

논문 정보

동작 과정 (Overview)

image

구조

image

총 24개의 CNN 레이어 계층으로 구성되어 있으며, 기존 신경망인 GoogLeNet을 사용하여 Classification에 사용했다. 위 구조는 논문에 기재된 구조이고, 더 간단히 표현하면 아래와 같다.

image

Loss

YOLO는 객체 탐지 및 classification을 해야 하므로 3가지 loss를 더한다. 여기서 공통적으로 i그리드의 index, jbounding box predictor index이다.

image

YOLO v2

2017년 CVPR에 동일 저자가 발표한 두 번째 버전이다. 이 작자는 천재가 틀림 없다. 제목부터 자신감이 넘친다. Better, Faster, Stronger.. 진짜 멋있다.

논문 정보

Better : 정확도 향상

Batch Normalization

High Resolution Classifier

Convolutional with Anchor Boxes

Dimension Clusters

Direct location prediction

image

Fine-Grained Features

image

image

Multi-Scale Training

image

Faster : detection 속도를 향상

Darknet-19

image

Training for classification

이 부분은 빨라지는 것과는 연관성이 떨어지지만 논문 순서에 따라 여기에 껴 있다. training 방법을 설명하기에 적절한 위치였던 것 같다.

Training for detection

Stronger : 더 많은 범위의 class를 예측

본 논문에서는 classification 데이터와 detection 데이터를 함께 사용하여 학습 함으로써 보다 많은 class를 예측하는 YOLO 9000을 소개한다. 여기서 detection 데이터셋은 범용적인 객체에 대한 정보를 가지고, classification 데이터셋은 보다 특징적인 정보를 가진다고 하자. 예를 들어, detection이 라면 classification은 중에서도 풍산개인 것이다.

읭 그러면 두 데이터셋을 배타적인 class로 분류할 가능성이 있는데 어떻게 하느냐? 하면 아래에 방법을 기술한다.

Hierarchical classification

image

Dataset combination with WordTree

위 방법으로 ImageNet Dataset + COCO Dataset WordTree를 구성한다. 그림은 아래에..

Joint classification and detection

image

이 같은 Joint training 방식을 통해 YOLO 9000 모델은 COCO 데이터셋을 활용하여 이미지 내에서 객체를 찾는 detection task와 ImageNet 데이터셋을 통해 보다 넓은 범주의 객체를 분류할 수 있도록 학습한다.

Training

Training은 크게 4가지 단계로 이루어진다.

  1. DarkNet-19로 Feature 추출
  2. Feature map 재구축 (reorganize)
  3. Feature map 결합 (concat)
  4. Conv layer를 적용한 예측

사실 위에 Better, Faster, Stronger를 설명하면서 모든 내용을 담았다. 한번 더 설명할 필요가 없다. loss function 또한 YOLO v1과 같은 방법을 사용했다고 한다. 따라서 생략

마치며

쓰다 보니 YOLO에 빠져서 내용이 너무 길어지고 있네요. 시리즈가 길어질 것 같습니다. YOLO 재밌어용

참고