
要約
弱教師あり学習は、オブジェクト検出やセマンティックセグメンテーションなど、画像内に詳細なラベルが必要なタスクにおいて、アノテーションコストを大幅に削減できる点から、近年注目を集めている。これまでの弱教師ありオブジェクト検出およびセマンティックセグメンテーションのアプローチは、反復的なラベルマイニングとモデル学習のパイプラインを採用している。しかし、このような自己強化型のパイプラインは、両タスクとも局所最適解に陥りやすいという課題を抱えている。本論文では、初めて弱教師ありオブジェクト検出とセグメンテーションをマルチタスク学習の枠組みで統合し、それぞれのタスクが抱える失敗パターンを互いに補完するように設計した。このタスク間相互強化により、両タスクとも各自の局所最適解から脱却することが可能となる。具体的には、効率的かつ効果的なフレームワークとして「弱教師あり同時検出・セグメンテーション(WS-JDS)」を提案する。WS-JDSは、2つのタスクにそれぞれ対応するブランチを備え、共通のバックボーンネットワークを共有する構成である。学習段階では、同じサイクル学習パラダイムを採用しつつ、タスクに特化した損失関数を用いることで、2つのブランチが互いに恩恵を及ぼすように設計されている。Pascal VOCおよびCOCOという広く用いられるベンチマーク上で多数の実験を行った結果、本モデルは最先端のアルゴリズムと比較しても競争力ある性能を達成したことが示された。