
要約
弱教師付き物体検出は、画像カテゴリの監督情報が与えられる一方で、物体の位置と物体検出器を同時に学習するという課題を抱えています。弱い監督情報と学習目標との間の一貫性の欠如は、物体の位置に大きなランダム性をもたらし、検出器に曖昧さを生じさせます。本論文では、弱教師付き物体検出のために最小エントロピー潜在モデル(Min-Entropy Latent Model: MELM)を提案します。最小エントロピーは、物体の位置を学習するためのモデルであり、学習過程における物体位置特定のランダム性を測定する指標としても機能します。その目的は、学習されたインスタンスの分散を原理的に削減し、検出器の曖昧さを軽減することです。MELMは提案クライク分割、物体クライク発見、および物体位置特定という3つの構成要素に分解されます。MELMは再帰的な学習アルゴリズムによって最適化され、このアルゴリズムは連続最適化を利用して難解な非凸問題を解決します。実験結果から、MELMが最新手法に対して弱教師付き物体検出、弱教師付き物体位置特定、および画像分類の性能を大幅に向上させることが示されています。