PointSAM: リモートセンシング画像のためのポイントベース教師付きセグメンテーションモデル

fulfulggg commented 2 months ago

タイトル: PointSAM: リモートセンシング画像のためのポイントベース教師付きセグメンテーションモデル

リンク: https://arxiv.org/abs/2409.13401

概要:

セグメント・エニシング・モデル（SAM）は、画像セグメンテーションの先進的な基盤モデルであり、リモートセンシング画像（RSI）に広く適用されています。RSIと自然画像の間にはドメインギャップが存在するため、従来の手法では、一般的にSAMをソース事前学習モデルとして使用し、完全に教師ありのマスクで微調整します。これらの手法とは異なり、本研究では、より便利で困難なポイントアノテーションを用いたSAMの微調整に焦点を当てています。SAMのゼロショット能力を活用し、自己学習フレームワークを採用して、学習用の疑似ラベルを反復的に生成します。ただし、疑似ラベルにノイズの多いラベルが含まれている場合、エラーが蓄積されるリスクがあります。この問題に対処するため、ターゲットデータセットからターゲットプロトタイプを抽出し、ハンガリアンアルゴリズムを使用して予測プロトタイプと照合することで、モデルが間違った方向に学習するのを防ぎます。さらに、RSIの複雑な背景とオブジェクトの密集した分布のため、ポイントプロンプトを使用すると、複数のオブジェクトが1つのオブジェクトとして認識される可能性があります。この問題を解決するため、インスタンスマスクの非重複性に基づいた、ネガティブプロンプトのキャリブレーション手法を提案します。簡単に言うと、重複するマスクのプロンプトを対応する負の信号として使用することで、マスクを調整します。上記の手法を組み合わせることで、PointSAMという新しいポイントベースの教師ありセグメント・エニシング・モデルを提案します。WHU、HRSID、NWPU VHR-10などのRSIデータセットを用いて実験を行った結果、本手法は、SAM、SAM2、およびその他の比較手法を用いた直接テストよりも大幅に優れていることが示されました。さらに、PointSAMをポイントツーボックスコンバーターとして導入し、有望な結果を得ており、この手法は他のポイントベースの教師ありタスクにも拡張できることが示唆されました。コードはhttps://github.com/Lans1ng/PointSAMで公開されています。

fulfulggg commented 2 months ago

論文要約