2ヶ月前
弱教師付き物体検出における不安定性の利用
Yan Gao; Boxiao Liu; Nan Guo; Xiaochun Ye; Fang Wan; Haihang You; Dongrui Fan

要約
弱教師付き物体検出(Weakly Supervised Object Detection: WSOD)は、画像レベルのアノテーションのみを使用して物体検出器を訓練することに焦点を当てており、教師と目的の間のギャップにより困難を伴います。既存の大多数の手法は、WSOD を多重インスタンス学習(Multiple Instance Learning: MIL)問題としてモデル化しています。しかし、我々は MIL に基づく検出器の結果が不安定であることを観察しました。つまり、異なる初期化を使用すると最も信頼性が高いバウンディングボックスが大幅に変化します。この不安定性を定量的に示すために、測定指標を導入し、経験的にその原因を分析しました。不安定性は検出タスクにとって有害と思われますが、我々は異なる初期化された検出器の結果を融合することで性能向上に利用できると考えています。このアイデアを実現するために、複数の検出ブランチを持つエンドツーエンドフレームワークを提案し、単純な融合戦略も導入しました。さらに、検出ブランチ間の差異を増加させるため、直交初期化法を提案しています。不安定性を利用することで、挑戦的な PASCAL VOC 2007 および 2012 データセットにおいてそれぞれ 52.6% および 48.0% の mAP を達成しました。これらは両方とも新しい最先端の成果です。