
要約
本稿では、tightなバウンディングボックスアノテーションのみを用いる弱教師付きインスタンスセグメンテーション手法を提案する。この手法の主な課題は、各バウンディングボックス内における前景と背景の分離が不確実であることである。これは、その分離に関する教師信号が存在しないために生じる。本研究では、この課題を複数インスタンス学習(Multiple Instance Learning: MIL)の枠組みとして定式化し、各バウンディングボックスのスイープライン(掃引線)に基づいてポジティブなバグとネガティブなバグを生成する。提案する深層モデルは、完全教師付きインスタンスセグメンテーションネットワークにMILを統合したものであり、単項項(unary term)と対項項(pairwise term)からなる目的関数によって定式化される。単項項は各バウンディングボックス内の前景領域と背景領域を推定するのに対し、対項項は推定されたオブジェクトマスクの整合性を維持する役割を果たす。実験結果から、本手法は既存の弱教師付き手法と比較して優れた性能を示し、PASCAL VOCデータセットにおいては一部の完全教師付き手法をも上回ることが明らかになった。