Disentangled Representation Learning GAN for Pose-Invariant Face Recognition

要約

2つの画像間のポーズの不一致は、顔認識における課題である。顔認識のためには、姿勢が変わっても変わらない不変である顔情報と、横顔などの画像を正面の画像に変換するしかない。

この2つの問題点を解決するために提案されたのが、DR-GANである。両方のタスクを共同で実行することがより望ましいと出張がされており、以下が特徴である。

特徴は下記2点

GeneratorがEncoder、Decoder形式になっており、識別表現を学習することができる
この表現学習は、GeneratorのポースコードとDiscriminatorのポーズ推定によるポーズの変化を通して、明確に「髪の色」「目の色」などに解きほぐす(disentangled)ことができる

inputの画像は、1枚でも複数の画像でも対応可能。

モデル図論文より引用