
要約
現在のクラスに依存しないカウント手法は未知のクラスにも汎化できるが、通常は対象となる物体の種類を定義するために参照画像が必要であり、訓練時にはインスタンスアノテーションも必要である。参照なしのクラスに依存しないカウントは、その本質が繰り返し認識タスクであると捉える新興分野である。このような手法は、セット構成が変化する場合でもカウントを容易にする。私たちは、全体的なコンテキストを持つ一般的な特徴空間を使用することで、画像中存在的する物体の種類に関する事前知識なしにインスタンスを列挙できることを示す。特に、ポイントレベルの監視や参照画像なしでビジョントランスフォーマー特徴から回帰を行う手法が他の参照なし手法よりも優れており、参照画像を使用する手法と競合することをFSC-147という現在の標準的な少ショットカウントデータセットで示している。また、FSC-147から誤り、曖昧さ、および重複した画像を取り除いた改善されたデータセットFSC-133を提案し、これでも同様の性能を達成することを示している。当該研究において私たちは、弱い教師ありかつ参照なしのクラスに依存しないカウント手法として初めてのものであることを確認している。(注:「弱い教師あり」は「weakly-supervised」に対応しています)