On Self Modulation for Generative Adversarial Networks

Ting Chen, Mario Lucic, Neil Houlsby, Sylvain Gelly

2018-10-02

1. どんなもの？

Generatorに入力されたノイズベクトルzで、Batch Normalizationのように特徴マップを入力で条件付けるモジュールであるSelf-Modulation層を提案した。ほとんどの条件設定で既存の手法よりも高い性能を示した。

既存のGANでSOTAを達成しているモデルでは、CBN (Conditional Batch Normalizatin) が使用されているが、この手法ではラベルなどの外部情報が必要であり常に使用できるとは限らない。

本研究では外部情報を必要とせず、Generatorの出力のみを使用するSelf-Modulation層を提案した。本モジュールはどのGeneratorにも追加できる。

外部情報を使用してGeneratorを改善する手法としては、(1)入力されるノイズベクトルにラベル情報を結合させるやり方と、(2)CBNを使用して隠れ層に直接ラベル情報を送るやり方が存在している。

まずはBNを復習すると、入力された特徴マップhlに対して平均と標準偏差を使用して正規化を行い、追加のパラメータでアフィン変換を行っている。

本研究で提案しているSelf-Modulationでは、最初に入力されたノイズベクトルzを使用してアフィン変換で使用していたγとβを条件付けを行っている。

各パラメータの計算には、入力されるノイズベクトルzに対して1層の次元数の少ないMLP層とReLUを適用し、その後に線形変換を施している。

ラベル情報を使用できる場合にも本手法にその情報を組み込むことが可能である。ラベル情報とノイズベクトルに関して2つのEmbedding層を使用してラベルベクトルに変換した後で、これら2つのベクトルとの相互関係を計算している。

以下が各Normalization手法との比較である。

以下がBaselineと本手法を適用した際の比較である。