Closed e4exp closed 3 years ago
本論文では、これまでの複雑なマルチステージ手法とは対照的に、エンド・ツー・エンドの半教師付きオブジェクト検出アプローチを紹介する。 エンド・ツー・エンドの学習により、カリキュラム中に疑似ラベルの品質が徐々に向上し、より正確な疑似ラベルが得られることで、物体検出の学習に役立つ。 また、このフレームワークの中で、シンプルかつ効果的な2つの手法を提案しています。 1つは、ラベルのないバウンディングボックスの分類損失を、教師ネットワークが生成した分類スコアで重み付けするソフト教師メカニズム、もう1つは、ボックス回帰の学習のために信頼できる擬似ボックスを選択するボックスジッタリングアプローチです。 COCOベンチマークにおいて、提案手法は、1%、5%、10%という様々なラベル付け比率の下で、従来手法を大差で上回る結果を得た。 さらに,提案手法は,ラベル付けされたデータ量が比較的多い場合にも優れた性能を発揮することがわかった. 例えば,COCOの全学習セットを用いて学習したベースライン検出器の40.9 mAPを,COCOの123Kのラベルなし画像を活用することで,+3.6 mAP改善し,44.5 mAPを達成した. Swin Transformerを用いた最先端のオブジェクト検出器(test-devでは58.9mAP)では、検出精度を+1.5mAP向上させて60.4mAPに達し、インスタンス分割精度を+1.2mAP向上させて52.4mAPに達しました。 さらに、Object365の学習済みモデルを組み込むことで、検出精度は61.3mAP、インスタンス分割精度は53.0mAPとなり、新たな最先端技術を獲得することができました。
duplicated
本論文では、これまでの複雑なマルチステージ手法とは対照的に、エンド・ツー・エンドの半教師付きオブジェクト検出アプローチを紹介する。 エンド・ツー・エンドの学習により、カリキュラム中に疑似ラベルの品質が徐々に向上し、より正確な疑似ラベルが得られることで、物体検出の学習に役立つ。 また、このフレームワークの中で、シンプルかつ効果的な2つの手法を提案しています。 1つは、ラベルのないバウンディングボックスの分類損失を、教師ネットワークが生成した分類スコアで重み付けするソフト教師メカニズム、もう1つは、ボックス回帰の学習のために信頼できる擬似ボックスを選択するボックスジッタリングアプローチです。 COCOベンチマークにおいて、提案手法は、1%、5%、10%という様々なラベル付け比率の下で、従来手法を大差で上回る結果を得た。 さらに,提案手法は,ラベル付けされたデータ量が比較的多い場合にも優れた性能を発揮することがわかった. 例えば,COCOの全学習セットを用いて学習したベースライン検出器の40.9 mAPを,COCOの123Kのラベルなし画像を活用することで,+3.6 mAP改善し,44.5 mAPを達成した. Swin Transformerを用いた最先端のオブジェクト検出器(test-devでは58.9mAP)では、検出精度を+1.5mAP向上させて60.4mAPに達し、インスタンス分割精度を+1.2mAP向上させて52.4mAPに達しました。 さらに、Object365の学習済みモデルを組み込むことで、検出精度は61.3mAP、インスタンス分割精度は53.0mAPとなり、新たな最先端技術を獲得することができました。