11日前

スパース半DETR:半教師あり物体検出のためのスパースな学習可能なクエリ

Tahira Shehzadi, Khurram Azeem Hashmi, Didier Stricker, Muhammad Zeshan Afzal
スパース半DETR:半教師あり物体検出のためのスパースな学習可能なクエリ
要約

本稿では、DETRに基づく半教師付き物体検出(SSOD)フレームワークの限界、特に物体クエリの品質に起因する課題に焦点を当てる。DETRベースのSSODにおいて、1対1の割り当て戦略は不正確な擬似ラベルを生成する一方で、1対多の割り当て戦略は予測の重複を引き起こす。これらの問題は、特に小さな物体や部分的に隠れた物体の検出において、学習効率を低下させ、モデル性能を劣化させる。そこで本研究では、新たなトランスフォーマー基盤のエンドツーエンド型半教師付き物体検出手法であるSparse Semi-DETRを提案する。Sparse Semi-DETRは、物体クエリの品質を向上させるQuery Refinement Moduleを導入し、小さな物体や部分的に遮蔽された物体に対する検出能力を著しく改善する。さらに、信頼性の高い擬似ラベルを効果的に選別するReliable Pseudo-Label Filtering Moduleを統合することで、検出精度と一貫性を向上させた。MS-COCOおよびPascal VOCの物体検出ベンチマークにおいて、Sparse Semi-DETRは現在の最先端手法を大きく上回る性能を達成し、特に小さな物体や部分的に隠れた物体を含む困難な状況下における半教師付き物体検出の有効性を明確に示している。