
要約
最近、弱教師付き物体検出は物体認識において重要な役割を果たしています。深層学習に基づく弱教師付き検出器は多くの有望な結果を達成しています。しかし、完全教師付き検出と比較すると、弱教師付きの方法で深層ネットワークベースの検出器を訓練することはより困難です。本研究では、弱教師付き検出を多次元インスタンス学習(Multiple Instance Learning: MIL)問題として定式化し、物体検出器(インスタンス分類器)をネットワーク内の隠れノードとして配置します。私たちは新しいオンラインインスタンス分類器改良アルゴリズムを提案し、MILとインスタンス分類器改良手順を単一の深層ネットワークに統合し、画像レベルの教師情報のみを使用してエンドツーエンドでネットワークを訓練します。つまり、弱教師から推論されたインスタンスラベルが空間的に重複するインスタンスに伝播され、オンラインでインスタンス分類器が改良されます。この反復的なインスタンス分類器改良手順は、深層ネットワーク内で複数のストリームを使用して実装され、各ストリームがその次のストリームを監督します。PASCAL VOC 2007および2012ベンチマークという難易度の高いデータセット上で弱教師付き物体検出手法の実験を行いました。VOC 2007において47%のmAP(平均精度)を得ることができ、これは従来の最先端手法を大幅に上回る結果となっています。