Glow: Generative Flow with Invertible 1×1 Convolutions

0. 論文情報・リンク

論文リンク：https://arxiv.org/abs/1807.03039
公開日時：2018/06/08
被引用数（記事作成時点）：198 件
実装コード：https://github.com/openai/glow

1. どんなもの？

フローベースの生成モデルにおいて、既存の先行研究である Real NVP に、invertible 1x1 conv を導入することによりアーキテクチャをよりシンプルにして計算効率を高め、更に生成画像の品質を高めたフローベースの生成モデル。

2. 先行研究と比べてどこがすごいの？

既存の先行研究である Real NVP において、新たに invertible 1x1 conv を採用することで、アーキテクチャの構造をシンプルにして、計算効率を高め、更に生成画像の品質を高めている。

3. 技術や手法の"キモ"はどこにある？

Activation normalization (act norm) を採用： Real NVP では、batch norm が採用されていたが、この batch norm では、解像度の高い画像を扱う際に GPU のメモリを大きく消費してしまう。一方でメモリ使用量を抑えようとバッチサイズ1 で学習を行うと、変動が増加して学習が不安定になってしまう。 Glow では、この問題を解決するために、Activation normalization (act norm) を採用する。これは、最初のミニバッチの平均値と分散値を用いて、各チャンネルに対してのアフィン変換用のスケール値とバイアス値を初期化して、以降はその初期化されたアフィン変換用のスケール値とバイアス値で学習を進めていくというデータ依存型初期化 [data dependent initialization] の正規化手法である？
invertible 1x1 conv： coupling layer では、各層で次元が一致している必要があるが、従来の NICE や Real NVP では、チャンネル数の順番を反転させる [reverse] ことで次元を一致させていた。一方 Glowでは、可逆な 1x1 の畳み込み処理を行うことで、複数の coupling layer 間の次元を一致させている。

これにより、アーキテクチャがよりシンプルになり、更に以下のグラフのように負の対数尤度がより小さくかつより速く収束する。これにより、生成画像の品質向上と計算効率の向上が見込めるようになるメリットがある。
affine coupling layer を採用： Real NVP と同様にして、General coupling layer として、affine coupling layer を採用している。 ※ NICE では、additive coupling layer
Multi-scale architecture の採用: Real NVP と同様にして、Multi-scale architecture を採用している。但し、invertible 1x1 conv の構造おかげで、Real NVP の Multi-scale architecture に比べて、シンプルな構造になっている。