Shape Matching Net による試着が容易な画像ペアの選定は、推論時のテスト用データを作成するのに使用しているのか、或いは学習用データセットを作成するのに使っているのかよくわからかった。後者の場合このプロセスは、学習用データセットのクレンジング処理で代用可能なので、あまりメリットが感じられない。前者の場合は、選定すれば品質向上するのは同然の結果であまり意味がないと感じる。
或いは、Shape Matching Net により選定された試着が容易な画像ペアは、元のデータセットに含まれている画像とは異なる生成された画像になっていて、この生成画像では試着が容易な画像ペアになるということ?
0. 論文情報・リンク
1. どんなもの?
2. 先行研究と比べてどこがすごいの?
3. 技術や手法の"キモ"はどこにある?
Shape Matching Net の概要
Shape Matching Net の詳細
Multi-warp Try-on Net
4. どうやって有効だと検証した?
既存の仮想試着モデルとの FID_∞ スコアでの比較から、本手法では一貫してスコアが改善していることを定量的に検証している。(blended は U-Net ではなく直接的な貼付けを用いた場合の設定)
既存の仮想試着モデルの試着画像(3段目)と比較して、本手法の試着画像(2段目)の試着品質のほうが優れていることを定量的に検証している。(※ 服境界での品質が向上しているのは、本手法では、WUTONのように人物画像における服部分のみを試着合成するため。)
変形服の枚数を1枚(k=1)→ 2枚(k=2)にすることでの品質改善すること(特に服のボタンやタグ位置など)を、定性的に検証している。
5. 議論はあるか?
6. 次に読むべき論文はあるか?
7. 参考文献