Open fulfulggg opened 1 week ago
カプセルネットワーク(CapsNet)に備わっている部分-全体の関係性は、セグメンテーションの完全性により、カモフラージュされた物体検出において有効であることが知られています。しかし、従来の期待値最大化(EM)カプセルルーティングアルゴリズムは、計算量とパラメータ数が多く、この傾向を阻害しています。その主な原因は、ピクセルレベルのカプセルルーティングにあります。そこで本稿では、タイプレベルで動作する新しいマンバカプセルルーティングを提案します。具体的には、まずマンバ内の潜在状態をカプセルベクトルとして抽出し、ピクセルレベルバージョンからタイプレベルカプセルを抽象化します。これらのタイプレベルマンバカプセルをEMルーティングアルゴリズムに入力することで、高レベルマンバカプセルを取得します。これにより、部分-全体関係の探索におけるピクセルレベルカプセルルーティングに起因する計算量とパラメータ数が大幅に削減されます。さらに、カモフラージュされた物体検出のためにピクセルレベルのカプセル特徴を取得するために、隣接するタイプレベルマンバカプセルの相関に基づき、低レベルピクセルレベルカプセルを用いて実現します。広く使用されている3つのCODベンチマークデータセットを用いた広範な実験により、提案手法が最先端技術を大幅に上回ることを示しています。コードはhttps://github.com/Liangbo-Cheng/mamba_capsuleで公開されています。
@yukihiko-fuyuki が以下のラベルを提案し、適用しました:
この論文では、迷彩物体検出における新しいアプローチであるマンバカプセルルーティングを提案しています。
従来手法の問題点:
提案手法:
成果:
要点:
コード: https://github.com/Liangbo-Cheng/mamba_capsule
タイトル: マンバカプセルルーティング:部品全体関係に基づく迷彩物体検出に向けて
リンク: https://arxiv.org/abs/2410.03987
概要:
カプセルネットワーク(CapsNet)に備わっている部分-全体の関係性は、セグメンテーションの完全性により、カモフラージュされた物体検出において有効であることが知られています。しかし、従来の期待値最大化(EM)カプセルルーティングアルゴリズムは、計算量とパラメータ数が多く、この傾向を阻害しています。その主な原因は、ピクセルレベルのカプセルルーティングにあります。そこで本稿では、タイプレベルで動作する新しいマンバカプセルルーティングを提案します。具体的には、まずマンバ内の潜在状態をカプセルベクトルとして抽出し、ピクセルレベルバージョンからタイプレベルカプセルを抽象化します。これらのタイプレベルマンバカプセルをEMルーティングアルゴリズムに入力することで、高レベルマンバカプセルを取得します。これにより、部分-全体関係の探索におけるピクセルレベルカプセルルーティングに起因する計算量とパラメータ数が大幅に削減されます。さらに、カモフラージュされた物体検出のためにピクセルレベルのカプセル特徴を取得するために、隣接するタイプレベルマンバカプセルの相関に基づき、低レベルピクセルレベルカプセルを用いて実現します。広く使用されている3つのCODベンチマークデータセットを用いた広範な実験により、提案手法が最先端技術を大幅に上回ることを示しています。コードはhttps://github.com/Liangbo-Cheng/mamba_capsuleで公開されています。