doublejy715 / Paper_review

Paper_review
1 stars 0 forks source link

Fine-Tuning StyleGAN2 For Cartoon Face Generation #8

Open doublejy715 opened 3 years ago

doublejy715 commented 3 years ago

Fine-Tuning StyleGAN2 For Cartoon Face Generation

Abstract

Limitations

1. Introduction

해당 논문에서는 stylegan2 model을 unsupervised I2I translation을 위해서 fine-tuning한다. source image와 target image를 비슷하게 만들어주는 2가지 방법을 소개한다.

  1. FreezeSG, style vector와 generator의 첫번째 블록을 고정시키는 방법. 이는 source image의 구조를 target image가 따라하도록 하는 간단한 방법이다.
  2. Structure Loss, source generator와 target generator의 처음 블록 간 거리를 줄여주기 위해서 Loss를 정의한다. 모델을 layer swaping하여 구현

2. Related Work

Generative Adversarial Networks(GANs)

Image-to-Image Translation

Transfer Learning

3. Method

3.1 FreezeSG

FreeezeG논문 [17]에 따른다면, image의 구조에 초반 generator layer과 style vector이 영향을 미친다. 이에 영감을 받아 처음 generator 블록을 얼리고, 처음 style vector input을 stylegan2의 fine-tuning된 값을 넣어주기로 한다. 이를 간단하게 FreezeSG라 칭한다. image Figure 1.

3.2 Structure Loss

3.1 section에서 FreezeSG의 효과를 볼 수 있었다. 그러나 generator의 low-resolution layer 가중치를 고정하고, low-ersolution layer을 layer swapping만 한다면 의미있는 결과를 얻기는 힘들다. 그렇기에 LS하여도 효과적이고 간단한 loss function을 소개한다. (called by structure loss)

Adversarial Loss

original GAN에서는 generator G와 discriminator D를 학습시켰다. G는 target domain과 유사한 사진을 만들도록 (loss를 최소화) 학습하고, D는 G가 만들어 내는 이미지를 가려내도록하는 학습을 한다.

Structure Loss

5

  1. n 개의 style block에 대해서 loss를 적용하고 싶다면, 우선 source generator와 target generator의 RGB output을 먼저 얻어야 한다.
  2. 각 resolution에 대해서 mse loss를 구하고 n-th layer까지 모두 더한다.

7

Full Objective

8 상수 $\lambda 값은 실험을 통하여 1임을 알아냈다.

4. Experiments

4.1. Datasets

Source domain dataset

Flickr-Faces-HQ(FFHQ) dataset 이용

Target domain dataset

4.2. Training details

FreezeSG

Layer Swapping(LS)

학습할 때 structure loss을 input/output skip architecture of the stylegan2 model에 적용. 이 loss는 source generator의 3 low-resolution layer 적용하였다.

4.3. Experiment Results

본 논문에서 보여준 모델은 FreezeD + ADA / FreezeG 모델보다 더 나은 모습을 보여주었다. 추가적으로 LS 기술을 적용하였을 때, source domain이 유지되어 결과물로 나왔다.

Compare

3

FIgure 5 : The results of applying structure loss with Layer Swapping

2

Figure 6 : The results of FreezeSG with Layer Swapping

4