fulfulggg / Information-gathering

Fusion of Python and GIMP
MIT License
0 stars 0 forks source link

蒸留深度キーポイント表現を用いた自己教師ありキーポイント検出 #515

Open fulfulggg opened 4 hours ago

fulfulggg commented 4 hours ago

タイトル: 蒸留深度キーポイント表現を用いた自己教師ありキーポイント検出

リンク: https://arxiv.org/abs/2410.14700

概要:

既存の教師なしキーポイント検出法は、画像の大部分をマスクしたり、元の画像の再構成を学習目標として使用したりするなど、人工的な変形を画像に適用してキーポイントを検出します。しかし、このアプローチは画像の奥行き情報が不足しており、背景にキーポイントを検出してしまうことがよくあります。この問題に対処するため、本研究では、深度マップとRGB画像を活用して、自己教師あり設定でキーポイント検出を行う、新しいクロスモーダル知識蒸留フレームワークであるDistill-DKPを提案します。トレーニング中、Distill-DKPは、深度ベースの教師モデルから埋め込みレベルの知識を抽出し、推論を生徒に限定した画像ベースの生徒モデルをガイドします。実験の結果、Distill-DKPは、Human3.6Mの平均L2誤差を47.15%、Taichiの平均平均誤差を5.67%削減し、DeepFashionデータセットのキーポイント精度を1.3%向上させるなど、従来の教師なし手法を大幅に上回る性能を示しました。詳細なアブレーション研究により、ネットワークの異なる層間における知識蒸留の感度が実証されました。プロジェクトページ: https://23wm13.github.io/distill-dkp/

fulfulggg commented 4 hours ago

論文要約

論文要約:

この論文は、画像から重要なポイント(キーポイント)を自動的に検出する新しい手法を提案しています。

fulfulggg commented 4 hours ago

@yukihiko-fuyuki が以下のラベルを提案し、適用しました: