
要約
画像レベルのアノテーションのみを使用して検出器を学習させる弱教師付き物体検出(Weakly Supervised Object Detection: WSOD)が、ますます注目を集めています。高性能な検出器を得るための方法として、検出器とインスタンスラベルを反復的に更新する手法があります。本研究では、より効率的な反復更新を実現するために、前回の局所化結果に基づいて各領域にどのラベルを付けるべきかというインスタンスラベリング問題に焦点を当てました。単に最高得点の領域とその重なりが大きい領域を正例、それ以外を負例としてラベリングするのではなく、以下のより効果的なインスタンスラベリング手法を提案します。まず、物体の一部だけをカバーしている領域が正例としてラベリングされやすい問題に対処するために、コンテキスト分類損失に注目し、物体全体をカバーしている領域を見つける方法を開発しました。次に、画像内に含まれる他の物体が負例としてラベリングされる状況を考え、負例としてラベリングされる領域に対して空間的な制約を課しました。これらのインスタンスラベリング手法を使用して、PASCAL VOC 2007および2012データセットで検出器を学習させた結果、他の最先端手法と比較して大幅な性能向上が得られました。