2ヶ月前
DAVE -- 低ショットカウントの検出と検証パラダイム
Pelhan, Jer ; Lukežič, Alan ; Zavrtanik, Vitjan ; Kristan, Matej

要約
少ショットカウンターは、画像に注釈が付いていないか、またはわずかな例のみが注釈されている状況下で、選択されたカテゴリに対応するオブジェクトの数を推定します。現在の最先端技術では、オブジェクト位置密度マップの合計値を基に総数を推定していますが、個々のオブジェクトの位置やサイズを提供せず、これらの情報は多くのアプリケーションにとって重要です。この問題は検出ベースのカウンターによって解決されますが、総数の精度では劣ります。さらに、両方のアプローチは他のオブジェクトクラスが存在する場合に偽陽性が多く発生し、総数を過大評価しがちです。我々はDAVE(Detect-and-Verify Ensemble)と呼ばれる少ショットカウンターを提案します。この方法はまず高リコール検出セットを生成し、その後検出結果を検証して外れ値を特定し削除することで、前述の問題を回避します。これによりリコールと精度が同時に向上し、正確なカウントが可能になります。DAVEは総数平均絶対誤差(MAE)においてトップレベルの密度ベースカウンターより約20%優れており、最新の検出ベースカウンターよりも検出品質で約20%上回っています。また、ゼロショットおよびテキストプロンプトベースのカウントにおいて新たな最先端技術となっています。