Alpha-Refine:正確なバウンディングボックス推定によるトラッキング性能の向上

視覚的オブジェクト追跡は、指定されたターゲットの境界ボックスを高精度で推定することを目的としており、変形や遮蔽といった要因により、困難な課題である。近年の多数の追跡手法は、境界ボックス推定の品質を向上させるためにマルチステージ追跡戦略を採用している。これらの手法は、まずターゲットを粗く位置決めし、その後の段階で初期予測を精緻化する。しかし、既存のアプローチは依然として精度の限界に直面しており、各ステージ間の強い結合が手法の汎用性を著しく制限している。本研究では、ベース追跡器の境界ボックス推定精度を著しく向上させるため、新しい柔軟性と高精度を兼ね備えた精緻化モジュール「Alpha-Refine(AR)」を提案する。さまざまな設計選択肢を検討した結果、成功する精緻化の鍵は、できるだけ詳細な空間情報を抽出・維持することであると結論づけた。この原則に従い、Alpha-Refineはピクセル単位の相関、コーナー予測ヘッド、および補助マスクヘッドを核心的な構成要素として採用している。TrackingNet、LaSOT、GOT-10K、VOT2020の複数のベンチマークにおいて、複数のベース追跡器を用いた包括的な実験により、本手法がわずかな追加遅延でベース追跡器の性能を顕著に向上させることを確認した。提案するAlpha-Refineは、ARSiamRPN(AR強化SiamRPNpp)およびARDiMP50(AR強化DiMP50)といった効率と精度のバランスに優れた追跡器を実現し、またARDiMPsuper(AR強化DiMP-super)はリアルタイム速度で非常に競争力のある性能を達成している。コードおよび事前学習済みモデルは、https://github.com/MasterBin-IIAU/AlphaRefine にて公開されている。