Open fulfulggg opened 2 weeks ago
@yukihiko-fuyuki が以下のラベルを提案し、適用しました:
画像圧縮における課題: 従来の画像圧縮技術 (JPEGなど) は、画像データを連続的な数値で表現するため、データを圧縮する際に「量子化」という処理が必要となり、画質の劣化を引き起こしていました。
提案手法: 本論文では、量子化を必要としない新しい画像圧縮手法を提案しています。
実験結果:
結論: 本研究で提案する量子化不要な画像圧縮手法は、従来手法よりも高画質かつ高効率な画像圧縮を可能にする promisingな技術です。
タイトル: 整数行列分解を用いた量子化不要の非可逆画像圧縮
リンク: https://arxiv.org/abs/2408.12691
概要:
非可逆画像圧縮は、効率的な伝送と保存に不可欠です。従来の圧縮手法は主に離散コサイン変換(DCT)または特異値分解(SVD)に依存しており、どちらも連続領域で画像データを表すため、綿密に設計された量子化器が必要となります。特に、SVDベースの手法は、JPEGのようなDCTベースの手法よりも量子化誤差の影響を受けやすいです。この問題に対処するため、量子化不要の新しい非可逆画像圧縮手法を開発するために、整数行列分解(IMF)のバリアントを導入します。IMFは、有界整数要素を持つ2つの小さな因子行列の積として画像データの低ランク表現を提供するため、量子化の必要性を排除します。ブロック座標降下法(BCD)スキームを使用し、閉形式解を持つ部分問題を持つ、IMFのための効率的で証明可能に収束する反復アルゴリズムを提案します。KodakおよびCLIC 2024データセットを用いた実験では、我々のIMF圧縮手法は、0.25ビット/ピクセル(bpp)未満の低ビットレートでJPEGよりも一貫して優れており、より高いビットレートでも同等の性能を維持することを示しています。また、圧縮画像上でImageNetで事前学習された分類器を評価することにより、視覚的な意味を保持する手法の能力も評価しました。注目すべきことに、我々の手法は、0.25 bpp未満のビットレートで、JPEGと比較してトップ1の精度が5パーセントポイント以上向上しました。このプロジェクトはhttps://github.com/pashtari/lrfで公開されています。