doublejy715 / Paper_review

Paper_review
1 stars 0 forks source link

Encoding in Style: a StyleGAN Encoder for Image-to-Image Translation(pSp) #10

Open doublejy715 opened 2 years ago

doublejy715 commented 2 years ago

Encoding in Style: a StyleGAN Encoder for Image-to-Image Translation(pSp)

Abstract

1. Introduction

Background

In this paper

main contribution

2. Related Work

Latent Space Embedding

Image-to-Image

Latent-Space Manipulation

3. The pSp Framework

3.1. Loss Functions

pSp encoder에 사용된 loss를 소개한다.

pixel-wise L2 loss

input image와 generated image의 픽셀 값 차이를 알기 위한 loss image

LPIPS loss

이미지 퀄리티를 보여주는 loss image

The Identitiy Loss

face generation의 주요 챌린지는 input / output image 의 특성을 잘 찾아내는 것이다. 앞의 loss들은 facial identity를 찾아내는데 덜 민감하므로, 코사인 유사도를 이용한 방법을 추가로 채택하였다. image

Summary

전체 loss 수식 image

3.2. The benefits of the styleGAN domain

pSp 네트워크를 이용한 image to style 방법은 기존 translation framework랑 많이 다르다. 이 pSp model은 픽셀 정보를 global하게 다룬다. This is a desired property as it has been shown that the locality bias limits current methods when handling non-local transformations.

3.3. Implementation Details

4. Applications and Experiments

Datasets

4.1. StyleGAN Inversion

pSp framework로 StyleGAN Inversion을 수행 가능한지 확인. ALAE encoder와 IDInvert를 비교 대상으로 삼았음.

Result

image

image

4.2. Face Frontalization

image-to-image translation의 도전과제 중 하나. 부족한 데이터셋이 문제. 이 도전과제는 3D alignment process과도 관련 있다.

image

4.3. Conditional Image Synthesis

4.3.1. Face From Sketch

image

image

4.3.2. Face from Segmentation Map

image

4.4. Super Resolution

image

4.5. Additional Applications