Open fulfulggg opened 6 days ago
方向付き物体検出は、物体の位置とバウンディングボックスに加えて、その向きも予測します。角度の周期性により境界不連続性や対称性の曖昧さが生じるため、向きの正確な予測は依然として困難です。本論文では、エッジ検出やコーナー検出の古典的な研究に着想を得て、方向付きバウンディングボックスにおける向きを構造テンソルとして表現することを提案します。この表現は、ガウシアンベースの手法と角度符号化ソリューションの利点を組み合わせた、シンプルでありながら効率的なアプローチであり、追加のハイパーパラメータなしで角度の周期性問題に対して堅牢です。5つのデータセットにおける広範な評価により、提案された構造テンソル表現は、完全教師ありタスクと弱教師ありタスクの両方において従来の手法を凌駕し、最小限の計算オーバーヘッドで高精度の角度予測を実現することが実証されました。これにより、構造テンソルは、方向付き物体検出における向きの符号化のための堅牢でモジュール化された代替手段として確立されます。コードは公開しており、既存の物体検出器へのシームレスな統合が可能です。
@yukihiko-fuyuki が以下のラベルを提案し、適用しました:
この論文は、画像中の物体の位置だけでなく、その「向き」も検出する技術を改善する新しい方法を提案しています。
簡単に言うと、この論文は、画像中の物体の向きをより正確かつ効率的に検出するための新しい「表現方法」を提案し、その有効性を示した、という内容です。
タイトル: 頑健な指向性物体検出のための構造テンソル表現
リンク: https://arxiv.org/abs/2411.10497
概要:
方向付き物体検出は、物体の位置とバウンディングボックスに加えて、その向きも予測します。角度の周期性により境界不連続性や対称性の曖昧さが生じるため、向きの正確な予測は依然として困難です。本論文では、エッジ検出やコーナー検出の古典的な研究に着想を得て、方向付きバウンディングボックスにおける向きを構造テンソルとして表現することを提案します。この表現は、ガウシアンベースの手法と角度符号化ソリューションの利点を組み合わせた、シンプルでありながら効率的なアプローチであり、追加のハイパーパラメータなしで角度の周期性問題に対して堅牢です。5つのデータセットにおける広範な評価により、提案された構造テンソル表現は、完全教師ありタスクと弱教師ありタスクの両方において従来の手法を凌駕し、最小限の計算オーバーヘッドで高精度の角度予測を実現することが実証されました。これにより、構造テンソルは、方向付き物体検出における向きの符号化のための堅牢でモジュール化された代替手段として確立されます。コードは公開しており、既存の物体検出器へのシームレスな統合が可能です。