Open Yongtae723 opened 4 years ago
従来のStyle Transfer GANは一つのドメイン(グループ)から違うもう一つのドメインの変換はできた。この変換は一対一対応であり、複数のドメイン間でStyle Transferを行おうとすると、多くのAIが必要になる。 starGANはその問題を解決したモデル。様々なドメインから、違うドメインにstyle transferを一つのAIで行えるAI
Face synthesize, GAN
https://arxiv.org/abs/1711.09020
Yunjey Choi
24 Nov 2017
従来のモデル(Cycle GAN, ACGAN)はドメインが一対一対応している。つまりinputとoutputに複数のドメインを含ませることができなかった。StarGAnではその問題が解決。
total loss関数を3つのloss 関数の重ね合わせで構成 adversarial loss : generatorが作成した画像が本物かどうか見分けるloss domein classification loss : 画像がどのドメインに属しているのかしめすloss reconstraction loss : input画像の情報を残すためのloss
このようにloss 関数を構築することで複数ドメインでも扱えるAIを構築した。
顔画像と感情のラベル付けされているdata set(RaFD), 有名人の顔画像のdataset(CelebA)を用いてinput画像の特徴(表情、性別、髪色、年齢)を変化させるGANを構築。
GANで構築された画像はAmazon mechanical tulkに高評価を受けた。 また、表情を認識するAIを構築し、GANで生成した顔画像の表情分類する。すると従来のGANより良い結果となった。
--
https://github.com/yunjey/stargan
4に同じ
ざっくり言うと
従来のStyle Transfer GANは一つのドメイン(グループ)から違うもう一つのドメインの変換はできた。この変換は一対一対応であり、複数のドメイン間でStyle Transferを行おうとすると、多くのAIが必要になる。 starGANはその問題を解決したモデル。様々なドメインから、違うドメインにstyle transferを一つのAIで行えるAI
キーワード
Face synthesize, GAN
1. 情報
論文リンク
https://arxiv.org/abs/1711.09020
著者
Yunjey Choi
投稿日付
24 Nov 2017
2. 先行研究と比べてどこがすごい?
従来のモデル(Cycle GAN, ACGAN)はドメインが一対一対応している。つまりinputとoutputに複数のドメインを含ませることができなかった。StarGAnではその問題が解決。
3. 技術や手法のキモはどこ?
total loss関数を3つのloss 関数の重ね合わせで構成 adversarial loss : generatorが作成した画像が本物かどうか見分けるloss domein classification loss : 画像がどのドメインに属しているのかしめすloss reconstraction loss : input画像の情報を残すためのloss
このようにloss 関数を構築することで複数ドメインでも扱えるAIを構築した。
4. どうやって有効だと検証した?
顔画像と感情のラベル付けされているdata set(RaFD), 有名人の顔画像のdataset(CelebA)を用いてinput画像の特徴(表情、性別、髪色、年齢)を変化させるGANを構築。
GANで構築された画像はAmazon mechanical tulkに高評価を受けた。 また、表情を認識するAIを構築し、GANで生成した顔画像の表情分類する。すると従来のGANより良い結果となった。
5. 議論はある?
--
6. 次に読むべき論文は?
--
7. 実装の詳細
https://github.com/yunjey/stargan
8. データセット
--
9. 結果の詳細
4に同じ
雑感&メモ