11日前

TOOD:タスク整合型ワンステージ物体検出

Chengjian Feng, Yujie Zhong, Yu Gao, Matthew R. Scott, Weilin Huang
TOOD:タスク整合型ワンステージ物体検出
要約

単段階物体検出は、通常、物体分類と局所化という2つのサブタスクを、並列な2本のブランチを持つヘッドを用いて最適化することで実現される。しかし、このアプローチは両タスク間で予測の空間的な不整合を引き起こす可能性がある。本研究では、学習に基づく手法によってこれらの2つのタスクを明示的に整合する「タスク整合型単段階物体検出(Task-aligned One-stage Object Detection, TOOD)」を提案する。まず、タスク間相互作用特徴とタスク固有特徴の間のより良いバランスを実現するとともに、タスク整合予測器を介して整合性を学習する柔軟性を備えた新規な「タスク整合ヘッド(T-Head)」を設計した。次に、設計されたサンプル割り当てスキームとタスク整合損失を用いて、訓練中に2つのタスクにおける最適なアンカーを明示的に近づける(あるいは統一する)「タスク整合学習(Task Alignment Learning, TAL)」を提案した。MS-COCOデータセット上で広範な実験を行った結果、TOODは単一モデル・単一スケールでのテストにおいて51.1 APを達成し、ATSS(47.7 AP)、GFL(48.2 AP)、PAA(49.0 AP)といった最近の単段階検出器を大きく上回った。さらに、パラメータ数およびFLOPsが少ないという点でも優位性を示した。定性的な結果からも、TOODが物体分類と局所化という2つのタスクの整合性をより良く実現できることを確認できた。コードは https://github.com/fcjian/TOOD で公開されている。

TOOD:タスク整合型ワンステージ物体検出 | 最新論文 | HyperAI超神経