doublejy715 / Paper_review

Paper_review
1 stars 0 forks source link

[ Skimming ] GAN Dissection: Visualizing and Understanding Generative Adversarial Networks #32

Open doublejy715 opened 2 years ago

doublejy715 commented 2 years ago

참조 홈페이지

Link 1 Link 2 GAN 내부를 이해해 보자는 의미에서 쓰여진 논문

0. Abstract

GAN과 그 변형된 모델들은 생성 퀄리티나 학습 안정성 면에서 많은 진전이 있었으나, GAN이 어떤 지식들을 학습할 필요가 있는지와 잘못된 결과들의 원인에 대해서는 여전히 의문이었음. (모델의 이해 / 시각화 면에서는 지지부진하였음)

해당 논문에서 GANs을 unit scale, object scale, scene scale에서 시각화하고 분석하는 프레임워크를 제안하였음.

일종의 image edit를 하기 위함??

1. Introduction

관점

연구 과제

사람이 물체를 살필 때 올바르게 있는지 판단하는 과정을 가지고 있다.

예를 들어, "문은 건물에 위치한다", 혹은 "문은 나무에 위치하지 않는다"와 같은 사실들.

논문에서는 GAN이 구조를 어떻게 표현하는지 알아본다.

위의 의문들을 해결하기 위해서 저자들은 neuron, object, contextual relationship 레벨에서 GANs을 이해하고 시각화하기 위한 general method를 제안한다.

2. Method

image

2.1 Dissection

생성된 이미지의 명시적 표현을 갖는 클래스 확인 generator 도중의 feature map(r)에서 activation이 높게 나타나는 영역과 생성된 이미지에서 segment후에 관측되는 영역을 비교한다. segment에서 관찰되는 영역과 feature map에서 나타나는 영역이 비슷한 영역인지 IoU방법으로 계산한다.(추가로 class로 알 수 있다.)

결과에 특정 클래스에 영향을 미치는 feature map을 확인 가능하다.

2.2 Intervention

해당 클래스를 on-off 하면서 이미지에서 영향을 확인 feature map(r)

특정 class c를 예측하는데 도움이 되는 feature map이 있는 반면, 도움이 되지 않는 feature map도 존재한다. 이를 각각 r{U,P}, r{bar{U,P}} 로 정의한다. generator 중간 feature map에서 특정 클래스 feature map 값을 추가하거나 빼서 결과 이미지를 확인한다.

3. Result

image

image 중반 layer에서는 4-7개의 object들과 매칭되는 unit 들을 관찰하였음.