Yagami360 / machine-learning-papers-survey

機械学習関連の論文Survey用レポジトリ
135 stars 6 forks source link

[CP-VTON] Toward Characteristic-Preserving Image-based Virtual Try-On Network #53

Open Yagami360 opened 4 years ago

Yagami360 commented 4 years ago

0. 論文情報・リンク

■ 概要

Characteristic-Preserving Virtual Try-On Network (CP-VTON) は、試着させたい服を試着者の体型や姿勢などに合わせて変形させることで、その服を実際に着ているかのような画像を生成する(3Dではない2次元の)画像ベースの仮想試着システム [Image-based virtual try-on systems] のアルゴリズムの1つである。

この仮想試着システムの目的は、目標の試着服を対象の試着者の形状にシームレスに変換することであるが、この際に、試着服の元の固有な形状(半袖、長袖など)や服の特性(テクスチャ、ロゴ、刺繍など)を変換先で保存していることが重要な要件になる。

しかしながら従来の仮想試着システムのアルゴリズム(VTON)での coarse-to-fine strategy では服の詳細を保存することが出来なかった。
そのため、仮想試着性能におけるこのような重要な要件を満たすことが出来ておらず、最もらしい仮想試着を行えていなかった。

cp-vton は、新しい Geometric Matching Module(GMM)と Try-On モジュール(TOM)の2つの機構から構成され、従来の仮想試着システムのアルゴリズムとは異なり、”end-to-end で学習可能な” アルゴリズムとなっている。
これにより、定性的にも定量的にも、仮想試着システムの SOTA(論文投稿日時:2018/07/20)を達成している。

※ 尚、この生成モデルのノートで紹介している他のアルゴリズムとは異なり、cp-vton は GAN のアルゴリズムを使用していないことに注意

又、従来の3Dコンピューターグラフィック手法による仮想試着システムでは、最もらしい仮想試着を行うことが出来るが、試着服の形状の3Dモデルや、試着者の3Dモデルを、手作業で作成しなくてはならないという問題が存在する。
その点 cp-vton は、3D情報に頼らない画像ベースの仮想試着システムであるので、このような手作業が必要ではないという大きなメリットが存在する。

◎ 仮想試着システムの定式化

image

image

新しい試着服 c と、服imageを着ている試着者imageの2つの画像が与えられているとする。
このとき、仮想試着システムである cp-vton の目的は、以下のような要件を満たす試着画像imageを生成することである。

  1. 試着者imageは、新しい試着服 c を着ている。
  2. 試着者imageの元の体型と姿勢が保持されている。
  3. 試着服 c のパーツが、他のパーツと滑らかに継ぎ目なく接続されている。
  4. 試着服 c の特性(テスクチャ、ロゴ、刺繍など)が、目立った歪みがなく、うまく保存されている。
  5. 古い服imageの効果が排除されている。

この問題を機械学習モデルで解くにあたっては、
学習フェイズにおける学習用データとして、機械学習モデルの入力 image と出力imageに対しての正解データimageに対応した{目標の試着服画像、対象の試着者画像、変換結果の教師データ}で構成される3つのデータの組 image が必要となる。

一方テストフェイズにおいては、入力データとして正解データを与えるので、機械学習モデルに入力する3つのデータの組は、image となる。

◎ CP-VTON のアーキテクチャ

image

上図は、cp-vton のアーキテクチャの全体構成を示した図である。
この cp-vton のアーキテクチャには、以下のような特徴がある。

◎ CP-VTON の実験結果

以下の表は、cp-vton の論文中での実験の実験条件を示している。
image