fulfulggg / Information-gathering

Fusion of Python and GIMP
MIT License
0 stars 0 forks source link

整数行列分解を用いた量子化不要の非可逆画像圧縮 #152

Open fulfulggg opened 2 weeks ago

fulfulggg commented 2 weeks ago

タイトル: 整数行列分解を用いた量子化不要の非可逆画像圧縮

リンク: https://arxiv.org/abs/2408.12691

概要:

非可逆画像圧縮は、効率的な伝送と保存に不可欠です。従来の圧縮手法は主に離散コサイン変換(DCT)または特異値分解(SVD)に依存しており、どちらも連続領域で画像データを表すため、綿密に設計された量子化器が必要となります。特に、SVDベースの手法は、JPEGのようなDCTベースの手法よりも量子化誤差の影響を受けやすいです。この問題に対処するため、量子化不要の新しい非可逆画像圧縮手法を開発するために、整数行列分解(IMF)のバリアントを導入します。IMFは、有界整数要素を持つ2つの小さな因子行列の積として画像データの低ランク表現を提供するため、量子化の必要性を排除します。ブロック座標降下法(BCD)スキームを使用し、閉形式解を持つ部分問題を持つ、IMFのための効率的で証明可能に収束する反復アルゴリズムを提案します。KodakおよびCLIC 2024データセットを用いた実験では、我々のIMF圧縮手法は、0.25ビット/ピクセル(bpp)未満の低ビットレートでJPEGよりも一貫して優れており、より高いビットレートでも同等の性能を維持することを示しています。また、圧縮画像上でImageNetで事前学習された分類器を評価することにより、視覚的な意味を保持する手法の能力も評価しました。注目すべきことに、我々の手法は、0.25 bpp未満のビットレートで、JPEGと比較してトップ1の精度が5パーセントポイント以上向上しました。このプロジェクトはhttps://github.com/pashtari/lrfで公開されています。

fulfulggg commented 2 weeks ago

@yukihiko-fuyuki が以下のラベルを提案し、適用しました:

fulfulggg commented 2 weeks ago

論文要約

論文要約: