Open fulfulggg opened 1 month ago
目的: 近赤外光 (NIR) 画像を可視光 (RGB) 画像に変換する、より高品質な手法の開発。
課題: 既存の変換モデルは、処理範囲の広さと計算効率の両立が難しい。
提案: ColorMambaと呼ばれる、Mambaと呼ばれる効率的なシーケンスモデルをベースにした新しい手法を提案。
ColorMambaの特徴:
結果:
@yukihiko-fuyuki が以下のラベルを提案し、適用しました:
以下の新しいラベルが作成され、適用されました:
タイトル: ColorMamba:Mambaを用いた高品質なNIR-to-RGBスペクトル変換に向けて
リンク: https://arxiv.org/abs/2408.08087
概要:
近赤外光を可視光に変換することは、領域間の複雑さのために困難な課題です。既存のモデルは、広い受容野と計算効率のバランスを取るのに苦労しており、実用化が制限されています。選択的構造化状態空間モデル、特にその改良版であるMambaは、線形計算量で長距離依存性を捉えることで生成タスクに優れていますが、2次元画像を1次元シーケンスに変換するというデフォルトのアプローチでは、局所的な文脈が無視されます。本研究では、ColorMambaと呼ばれるシンプルだが効果的なバックボーンを提案し、スペクトル変換タスクにMambaを初めて導入します。効率的なスペクトル変換のための広域な長距離依存性と局所的な文脈を調べるために、学習可能なパディングトークンを導入し、画像境界の区別を強化し、シーケンスモデル内の潜在的な混乱を防ぎます。さらに、ローカル畳み込みエンハンスメントとエージェントアテンションは、従来のMambaを改善するために設計されています。さらに、HSV色空間を活用して、より正確なスペクトル変換のために、再構成プロセスにおいてマルチスケールガイダンスを提供します。広範な実験により、ColorMambaは、最先端技術と比較してPSNRで1.02の改善を達成することが示されました。コードはhttps://github.com/AlexYangxx/ColorMambaで公開されています。