2ヶ月前
グループ協力学習による共通注目物体検出
Fan, Qi ; Fan, Deng-Ping ; Fu, Huazhu ; Tang, Chi Keung ; Shao, Ling ; Tai, Yu-Wing

要約
私たちは、グループ協調学習フレームワーク(GCoNet)を提案します。このフレームワークは、2つの必要条件に基づいてグループレベルで共通表現を同時に掘り起こすことで、共に注目される物体(co-salient objects)をリアルタイム(16ミリ秒)で検出することが可能です。これらの必要条件は以下の通りです:1) グループ内のコンパクトさ(intra-group compactness):共に注目される物体間の一貫性をよりよく定式化するために、それらの固有の共有属性を捉える新しいグループ親和性モジュール(group affinity module)を使用します。2) グループ間の分離可能性(inter-group separability):ノイジーな物体の影響を効果的に抑制するために、不整合な共通表現を制御する新しいグループ協調モジュール(group collaborating module)を導入します。より良い埋め込み空間を学習しつつ追加的な計算負荷なしでこれを実現するために、明示的に補助的な分類監督を使用しています。3つの挑戦的なベンチマークデータセット、すなわちCoCA、CoSOD3k、Cosal2015において広範な実験を行い、単純なGCoNetが10種類の最先端モデルを超えて新たな最先端性能を達成したことを示しました。本論文では、コンテンツ認識共セグメンテーションやコローケーションに基づく自動サムネイル生成など、重要な下流コンピュータビジョン応用における新しい技術的貢献も示しています。