On Face Segmentation, Face Swapping, and Face Perception

0. 論文情報・リンク

画像の顔のランドマーク情報から、それに沿うように平均的な顔の3Dモデルの変形を推定し、変形した3Dモデル上の可視部分（＝顔すり替え部分となる）をセグメンテーションすることで、顔すり替えを行う。

下図のような手順で、顔すり替えを行う。
1. 入力されたソース画像とターゲット画像 (a) の顔のランドマーク (b) から、平均的な顔の 3D モデル（Basel Face Model (BFM)）の形状や3D 上の姿勢や表情を推定する。（※ ランドマークの検出は、既存の検出器を使用する。）
2. ピクセル度の顔の可視部分を予想出来るように学習された FCN で、顔の可視部分をモデルの内容と背景から顔をセグメンテーション化する。(c)（※ 顔の可視部分が、顔すり替え部分に対応するので、可視部分をセグメンテーション化して顔すり替えを行う。）
3. 2つの変形した3D顔の形状をターゲットの3D形状に合うように歪めて (d)、ターゲット画像にブレンドする。(e)

Labeled Faces in the Wild（LFW）ベンチマークを使用して、被験者内および被験者間の顔スワッピングの効果を測定。
- FCN のアーキテクチャは、Pascal データセット用にファインチューニングされた FCN-8s-VGG のアーキテクチャを採用。
- FCN でのセグメンテーションの学習データは、IARPA Janus CS2 データセットの動画のフレームにある顔画像とラベル付されたセグメンテーション画像