2ヶ月前

Fewer is More:部分集約を用いた弱教師ありオブジェクト検出に基づく画像セグメンテーション

{Qi Qi, Jianxin Liao, Haifeng Sun, Jingyu Wang, Ce Ge}
Fewer is More:部分集約を用いた弱教師ありオブジェクト検出に基づく画像セグメンテーション
要約

弱教師付きオブジェクト検出における主要な失敗要因に対処することを検討する。多くの弱教師付きオブジェクト検出手法は事前に生成された候補領域(proposal)に基づいているため、以下の2つの誤検出が頻発する:(i) 複数のオブジェクトインスタンスを1つのバウンディングボックスでグループ化してしまうこと、および (ii) オブジェクト全体ではなく部分的な領域に注目してしまうこと。本研究では、個々のオブジェクトインスタンスを正確に検出するための画像セグメンテーションフレームワークを提案する。入力画像は、候補領域の重なりに基づいて複数の部分画像に分割され、オブジェクトのグループ化を解消する。その後、これらの部分画像のバッチを畳み込みネットワークに投入し、オブジェクト検出器を学習させる。各部分画像内では、提案レベルのスコアの一部を動的に選択する部分的集約戦略(partial aggregation strategy)を採用し、部分画像レベルの出力を生成する。これにより、モデルがオブジェクトの内容に関する文脈知識を学ぶことを正則化する。最後に、各部分画像の出力を統合(プーリング)することで、モデルの最終予測を生成する。本手法は、最近の最先端の弱教師付き手法と比較可能なVGG-Dバックボーンを用いて実装された。PASCAL VOCデータセットにおける広範な実験の結果、提案手法の優位性が示された。本モデルは、検出、局所化、分類の各タスクにおいて、他の代替手法を上回る性能を発揮した。