7日前

遮蔽検出を改善するための三層プラグイン

Guanqi Zhan, Weidi Xie, Andrew Zisserman
遮蔽検出を改善するための三層プラグイン
要約

部分的に遮蔽された物体の検出は、現在の最先端オブジェクト検出器にとって依然として課題である。本研究の目的は、こうした物体の検出性能を向上させることにより、現代的なオブジェクト検出器全体の性能を改善することである。そのため、以下の4つの貢献を行う。(1) 二段階オブジェクト検出器の検出ヘッドに容易に組み込める「プラグイン型」モジュールを提案する。このモジュールは、対象オブジェクト、遮蔽物(occluder)、遮蔽される物体(occludee)の3層に分かれたセグメンテーションマスクを予測することで、対象オブジェクトのマスク推定をより正確に行うことが可能となる。(2) 既存のオブジェクト検出およびインスタンスセグメンテーションの学習データセットを用いて、アモーダル補完(amodal completion)を実施することで、遮蔽関係を自動的に構築するスケーラブルな学習データ生成パイプラインを提案する。(3) 部分的に遮蔽された物体および分離された物体の検出再現率(recall)を評価するための、COCO評価データセットを構築した。(4) 二段階検出器にこのプラグインモジュールを挿入することで、検出ヘッドの微調整のみで性能が顕著に向上することを示した。さらに、全体アーキテクチャを微調整することで、さらなる性能向上も達成できる。実験結果は、Swin-TまたはSwin-SをバックボーンとするMask R-CNN、およびSwin-BをバックボーンとするCascade Mask R-CNNに対して報告されている。

遮蔽検出を改善するための三層プラグイン | 最新論文 | HyperAI超神経