Open fulfulggg opened 2 months ago
arXiv:2409.07896v1 発表タイプ: 新規 概要: 医療用顕微鏡画像分類 (MIC) の分野では、CNN ベースおよび Transformer ベースのモデルが広く研究されてきました。しかし、CNN は長距離依存性のモデリングに苦労しており、画像内の意味情報を十分に活用する能力が制限されています。逆に、Transformer は、二次計算の複雑さによって妨げられています。これらの課題に対処するため、Mamba アーキテクチャに基づくモデルである Microscopic-Mamba を提案します。具体的には、Visual State Space Module (VSSM) の最後の線形層を置き換える Partially Selected Feed-Forward Network (PSFFN) を設計し、Mamba のローカル特徴抽出機能を強化しました。さらに、グローバル機能とローカル機能を効果的に調整および動的に集約するために、Modulation Interaction Feature Aggregation (MIFA) モジュールを導入しました。また、パラメータ数を削減しながら、チャネル間情報相互作用を改善するために、並列 VSSM メカニズムを組み込みました。広範な実験により、私たちのメソッドが 5 つの公開データセットで最先端のパフォーマンスを達成することが実証されました。コードは https://github.com/zs1314/Microscopic-Mamba で入手できます。
@yukihiko-fuyuki が以下のラベルを提案し、適用しました:
従来の課題:
Microscopic-Mamba の提案:
具体的な改善点:
成果:
タイトル: Microscopic-Mamba:わずか4Mのパラメータで顕微鏡画像の秘密を解き明かす
リンク: https://arxiv.org/abs/2409.07896
概要:
arXiv:2409.07896v1 発表タイプ: 新規 概要: 医療用顕微鏡画像分類 (MIC) の分野では、CNN ベースおよび Transformer ベースのモデルが広く研究されてきました。しかし、CNN は長距離依存性のモデリングに苦労しており、画像内の意味情報を十分に活用する能力が制限されています。逆に、Transformer は、二次計算の複雑さによって妨げられています。これらの課題に対処するため、Mamba アーキテクチャに基づくモデルである Microscopic-Mamba を提案します。具体的には、Visual State Space Module (VSSM) の最後の線形層を置き換える Partially Selected Feed-Forward Network (PSFFN) を設計し、Mamba のローカル特徴抽出機能を強化しました。さらに、グローバル機能とローカル機能を効果的に調整および動的に集約するために、Modulation Interaction Feature Aggregation (MIFA) モジュールを導入しました。また、パラメータ数を削減しながら、チャネル間情報相互作用を改善するために、並列 VSSM メカニズムを組み込みました。広範な実験により、私たちのメソッドが 5 つの公開データセットで最先端のパフォーマンスを達成することが実証されました。コードは https://github.com/zs1314/Microscopic-Mamba で入手できます。