StyleGAN2 のアーキテクチャをベースに、識別器の入力に対して、モデルの過学習状態指標に依存して適合的に変化するデータオーギュメントである ADA [adaptive discriminator augmentation] を行うことで、少数の学習用データセットでもうまく高品質の画像生成することを実現した GAN ベースの noize-to-image モデル
2. 先行研究と比べてどこがすごいの?
GAN により画像生成モデルでは、一般的に多量の学習用データが必要であるが、このような多量の学習用データの収集は困難であることが多いという問題が存在する。
学習用データ不足に対する一般的な対策は、学習用データのデータオーギュメント(DA)であるが、DAの程度や確率をうまく調整しないと、入力画像に対してのDAがそのまま出力画像に "漏れる [leak]"(例えば、回転DAをした結果出力画像も回転してしまうなど) ケースが発生する。
本手法では、StyleGAN 2 のアーキテクチャをベースにして、識別器の入力に対して、モデルの過学習状態指標によって DA する確率が適合的に変形する ADA [adaptive discriminator augmentation] を行うことで、ハイパーチューニングなしに最適な DA が行われるようにして、このような DA の漏れ問題を軽減し、結果として少数の学習用データセットでも品質の高い生成画像を生成出来るようにしている。
3. 技術や手法の"キモ"はどこにある?
GAN モデルにおける過学習とDA効果の分析
本手法では、まずGAN モデルにおける過学習とDA による出力画像への漏れ [leak] 問題の分析を行っている。
0. 論文情報・リンク
1. どんなもの?
2. 先行研究と比べてどこがすごいの?
3. 技術や手法の"キモ"はどこにある?
GAN モデルにおける過学習とDA効果の分析 本手法では、まずGAN モデルにおける過学習とDA による出力画像への漏れ [leak] 問題の分析を行っている。
学習用データの枚数と GAN モデルの過学習
DA による出力画像への漏れ [leak] 問題
本手法のアーキテクチャと ADA
4. どうやって有効だと検証した?
学習用データセット
bCR との比較検証
定量検証
5. 議論はあるか?
6. 次に読むべき論文はあるか?
7. 参考文献