11日前

Semi-DETR:検出Transformerを用いたセミスーパーバイズドオブジェクト検出

Jiacheng Zhang, Xiangru Lin, Wei Zhang, Kuo Wang, Xiao Tan, Junyu Han, Errui Ding, Jingdong Wang, Guanbin Li
Semi-DETR:検出Transformerを用いたセミスーパーバイズドオブジェクト検出
要約

我々は、半教師あり物体検出(SSOD)におけるDETRベースのフレームワークを分析し、以下の2点を観察した。(1)1対1のアサインメント戦略は、仮の真値バウンディングボックス(pseudo ground-truth bounding box)が不正確な場合に誤ったマッチングを生じさせ、学習効率を低下させる;(2)DETRベースの検出器は、入力クエリとその予測出力との間に決定論的な対応関係を備えておらず、これにより現在のSSOD手法で広く用いられている一貫性に基づく正則化の適用が困難になる。このような課題に対処するため、本研究では、初めてトランスフォーマーに基づくエンドツーエンド型半教師あり物体検出器「Semi-DETR」を提案する。具体的には、第1段階の学習効率を向上させ、第2段階の学習に高品質な仮ラベルを提供するために、1対多アサインメントと1対1アサインメントを統合した「段階的ハイブリッドマッチング戦略(Stage-wise Hybrid Matching)」を提案する。さらに、異なる視点からのオブジェクトクエリの意味的特徴不変性を学習しつつ、決定論的なクエリ対応を求める必要を回避する「クロスビュークエリ一貫性(Crossview Query Consistency)」を導入する。また、仮の真値バウンディングボックスのマッチングコストに基づき、一貫性学習用に動的により多くの仮ボックスを抽出する「コストベースの仮ラベルマイニングモジュール(Cost-based Pseudo Label Mining module)」も提案する。COCOおよびPascal VOCの両ベンチマークデータセットにおけるすべてのSSOD設定において、膨大な実験を通じて、Semi-DETRが既存の最先端手法を明確な差で上回ることを確認した。PaddlePaddle版の実装コードは以下のURLにて公開されている:https://github.com/PaddlePaddle/PaddleDetection/tree/develop/configs/semi_det/semi_detr。