suger-131997 / papers

0 stars 0 forks source link

Variable Rate Deep Image Compression With a Conditional Autoencoder #2

Open suger-131997 opened 3 years ago

suger-131997 commented 3 years ago

0. 論文情報

タイトル:Variable Rate Deep Image Compression With a Conditional Autoencoder 著者:Choi, Y., El-Khamy, M., & Lee, J.

投稿日:2019 学会/ジャーナル:IEEE/CVF International Conference on Computer Vision. 2019

1. 概要

深層学習を用いて画像圧縮をする際に、条件付きオートエンコーダを用いることで圧縮の品質を制御できるようにする研究。

2. 手法

オートエンコーダで画像の再構築を行うことで、画像の潜在表現を学習する。この潜在表現をエントロピー符号化することで画像の圧縮ができる。 エントロピー符号化は、圧縮率の下限がエントロピーになるため潜在表現のエントロピーを最小化するように学習することで圧縮率を高めることができる。 潜在変数はuniversal quantizationで量子化することで離散化しつつ、勾配降下で学習ができる。

この論文では、圧縮の品質を制御するためのパラメータとしてλとΔを導入している。 λは潜在変数のエントロピーの最小化項の係数であり、大きいほど圧縮率が上がり品質が下がる。 Δは量子化のビンの大きさであり、ビンを大きさで品質を制御できる。 これらのパラメータを条件ベクトルとしてオートエンコーダに入力しながら、学習することで品質の制御を実現する。

3. 結果

ImageNet ILSVRC2012データセットや画像圧縮のチャレンジであるCLICの画像圧縮の実験を行い JPEG2000やBPGなどの画像圧縮手法より優れたパフォーマンスを達成した。 また、品質ごとにネットワークの学習をする必要がないため効率が良い。

4. 議論等

提案したネットワークはラグランジュの乗数で定式化できる最適化問題に適用できる可能性がある。

suger-131997 commented 3 years ago

5. 感想