e4exp / paper_manager_abstract

0 stars 0 forks source link

Towards Reducing Labeling Cost in Deep Object Detection #561

Open e4exp opened 3 years ago

e4exp commented 3 years ago

ディープニューラルネットワークは、物体検出において非常に高い精度を達成しているが、その成功は大量のラベル付きデータに依存している。 ラベルへの依存度を低減するために、様々なアクティブラーニング戦略が提案されており、通常は検出器の信頼度に基づいています。 しかし,これらの手法は,最も性能の良いクラスに偏っており,テストセットのデータの良い代表ではないデータセットを取得してしまう可能性がある. 本研究では、能動学習のための統一的なフレームワークを提案する。 このフレームワークでは、検出器の不確実性と頑健性の両方を考慮し、ネットワークがすべてのクラスで正確に動作することを保証する。 さらに、我々の手法は、非常に自信のある予測に疑似ラベルを付けることで、潜在的な分布ドリフトを抑制し、モデルの性能をさらに高めることができる。 実験によると、本手法は、PASCAL VOC07+12およびMS-COCOにおいて、様々なアクティブラーニング手法を包括的に凌駕し、最大で7.7%の相対的な改善、または最大で82%のラベリングコストの削減を実現した。

e4exp commented 3 years ago

1 はじめに

ディープオブジェクト検出ネットワーク[16, 19]の性能は,ラベル付きデータセットのサイズに大きく依存する. ラベル付けされたデータを増やすことは有効だが,データを増やすことはコストがかかる. これを受けて,研究者たちは,ラベリングのためにデータセットの中で最も情報量の多いサンプルを選択するためのスマートな戦略を研究してきた.

サンプルの選択は、獲得関数の定義に基づいて行われる。 獲得関数は、通常、ネットワークの不確実性を用いて計算され、それにより、ネットワークが予測に関して最も自信のないサンプルをラベル付けのために選択する。 しかし、この手法には2つの問題がある。獲得関数が意味を持つのは、ネットワークがすでにタスクに対して十分に訓練されている場合のみであり、ALの初期サイクルでは必ずしもそうとは限らない。 また、ネットワークがほとんどのクラスで良い性能を発揮したとしても、データセット内でそのクラスが十分に表現されていなかったり、クラス内分散のために、特定のクラスでの精度が低い場合がある。 このような場合、ネットワークの予測値を用いてALの獲得関数を計算すると、ランダムサンプリングを用いた場合よりも悪い性能になることが多い。

さらに、最も不確実なサンプルのみを対象とすることで、獲得データセットには、容易な(情報のない)サンプル、つまりネットワークが確実なサンプルが含まれないため、テストセットと比べて分布が大きく異なる可能性がある。 バランスのとれたデータセットを作るためには,イージーサンプルを含める必要があります. しかし、単純に標準的なALサイクルにそれらを含めることは、ネットワークが確かなサンプルにラベルを付けることになるため、資源の無駄遣いとなる。

本研究では、上述の問題に対処するための能動学習フレームワークを提案する。 我々のフレームワークには2つの重要な要素がある:ハードサンプルに対するロバストネスベースの獲得関数とイージーサンプルに対する疑似ラベリングスキームである。

獲得関数は、ネットワークのロバスト性に基づいており、一貫性損失を用いているため、クラスに依存せず、結果としてネットワークが正確でないクラスのオブジェクトに対しても信頼性がある。 具体的には,画像とその画像を水平方向に反転させるなどして拡張したものをネットワークに与え,一貫性のある予測値を出力するようにネットワークを学習させる[9]. そして,元の画像とその拡張版の予測値の差を,その正しさを無視して計算します. ALの際には,獲得関数と同じ一貫性損失を用いる.経験的には,この方法が従来のALアプローチの欠点に悩まされないことを示している.

この取得関数は、最も情報量の多い(ハード)サンプルに偏っているため、結果として得られるデータセットは、テスト時の実際の分布を表さなくなってしまう。 そこで、ラベリングのコストを増やすことなく、データセットの分布の偏りを補うために、イージーサンプルを組み込むために、疑似ラベリングスキームを提案する。 つまり、能動学習サイクルごとに、以前に学習したネットワークを用いてイージーサンプル、つまりネットワークが予測に自信を持っているサンプルをマイニングし、ネットワーク自身の予測を疑似ラベルとして使用するのである。 これらのラベルは、次のALサイクルでのネットワークの学習に使用されます。 これは自動ラベル付けプロセスであるため、余分なラベル付けコストはかからず、ラベル付け予算をすべてハードサンプルに費やすことができます。

要約すると、我々の貢献は以下の通りである。

image