一般化フォーカルロス V2: デンシー物体検出のための信頼性のある位置特定品質推定の学習

位置推定の品質評価(Localization Quality Estimation, LQE)は、最近の密集物体検出器の進歩において重要な役割を果たしており、非最大値抑制処理に有利な正確なランキングスコアを提供し、検出性能を向上させることが可能です。既存の方法では、一般的に、物体分類やバウンディングボックス回帰と共有される通常の畳み込み特徴量を通じてLQEスコアを予測しています。本論文では、LQEを行う全く新しい視点を探求します。これは、バウンディングボックスの4つのパラメータの学習された分布に基づいています。これらの分布はGFLV1で「一般分布」(General Distribution)として導入され、予測されたバウンディングボックスの不確実性をよく説明しています。この特性により、バウンディングボックスの分布統計がその実際の位置推定品質と強く相関することが示されています。具体的には、鋭いピークを持つバウンディングボックス分布は通常高い位置推定品質に対応し、逆もまた真です。分布統計と実際の位置推定品質との密接な相関関係を利用することで、我々は信頼性のあるLQEのために非常に軽量な分布ガイド型品質予測器(Distribution-Guided Quality Predictor, DGQP)を開発しました。これによりGFLV2が生成されます。最善の知識に基づく限り、これは物体検出において高関連性のある統計的表現を使用してLQEを促進する最初の試みです。広範囲にわたる実験結果は我々の手法の有効性を示しています。特に、GFLV2(ResNet-101)はCOCO {\tt test-dev}で46.2 APを14.6 FPSで達成しており、以前の最先端であるATSSベースライン(43.6 APを14.6 FPSで達成)に対して絶対値で2.6 AP上回っています。訓練および推論における効率性を犠牲にすることなくこのような成果が得られています。コードはhttps://github.com/implus/GFocalV2にて公開予定です。