3ヶ月前
W2F:オブジェクト検出のための弱教師ありから完全教師ありへのフレームワーク
{Yongqiang Zhang, Yancheng Bai, Mingli Ding, Yongqiang Li, Bernard Ghanem}

要約
近年、教師付きバウンディングボックスのアノテーションを必要としないため、弱教師ありオブジェクト検出は注目を集めている。一方で、著しい進展が見られたものの、弱教師あり検出と完全教師あり検出の間には依然として大きな性能ギャップが存在している。最近の研究では、弱教師あり検出器によって生成された疑似正解(pseudo ground-truth)を用いて、教師あり検出器を訓練するアプローチが提案されている。しかし、こうした手法はオブジェクトの最も代表的な部分に注目しがちであり、同一クラスの複数のインスタンスが存在する場合でも、クラスごとに一つの正解ボックスしか探索しない傾向がある。こうした課題を克服するため、本研究では複数インスタンス学習(Multiple Instance Learning, MIL)を用いて弱教師あり検出器を実装する弱教師ありから完全教師ありへのフレームワークを提案する。さらに、画像内の各インスタンスに対する疑似正解を発掘する「疑似正解発掘(Pseudo Ground-Truth Excavation, PGE)」アルゴリズムと、PGEによって得られた疑似正解をさらに精緻化する「疑似正解適応(Pseudo Ground-Truth Adaptation, PGA)」アルゴリズムを設計した。最終的に、これらの疑似正解を用いて完全教師あり検出器を訓練する。PASCAL VOC 2007および2012という困難なベンチマーク上での広範な実験により、本フレームワークの有効性が強く示された。VOC2007およびVOC2012において、それぞれ52.4%および47.8%のmAPを達成し、従来の最先端手法に対して顕著な性能向上を実現した。